+ Что мы измеряем +
+Этапы первой загрузки: +
-
+
- подготовка; +
- загрузка статики (HTTP-запрос и парсинг); +
- исполнение модулей; +
- инициализация базовых объектов; +
- отрисовка. +
Этапы отрисовки любой страницы: +
-
+
- подготовка к запросу на сервер; +
- запрос данных с сервера; +
- шаблонизация; +
- обновление DOM. +
Ок, теперь у нас есть метрики, мы можем отправить их на сервер- говорим мы
+ —
Что же дальше?- вопрошаете вы
+ —
А давай построим график!- отвечаем мы
+ —
А что будем считать?- уточняете вы
+ +
+ Как вы знаете, медиана – это серединное, а не среднее значение в выборке. + Если у нас имеются числа 1, 2, 2, 3, 8, 10, 20, то медиана – 3, а среднее – 6,5. + В общем случае медиана отлично показывает, сколько грузится средний пользователь. +
+ В случае ускорения или замедления медиана, конечно, изменится. Но она не может + рассказать, сколько пользователей ускорилось, а сколько замедлилось. +
+ APDEX – метрика, которая сразу говорит: хорошо или плохо. Метрика
+ работает очень просто. Мы выбираем временной интервал [0; t], такой, что если
+ время показа страницы попало в него, то пользователь счастлив. Берем еще один
+ интервал, (t; 4t] (в четыре раза больше первого), и считаем, что если страница
+ показана за это время, то пользователь в целом удовлетворен скоростью работы,
+ но уже не настолько счастлив. И применяем формулу:
+
+
+ (кол-во счастливых пользователей + кол-во удовлетворенных / 2) / (кол-во всех).
+
+
+ Получается значение от нуля до единицы, которое, видимо, лучше всего показывает,
+ хорошо или плохо работает почта.
+
+
+ Как мы измеряем +
++ Сейчас модуль обновления сам логирует все свои стадии, и можно легко понять + причину замедления: медленнее стал отвечать сервер либо слишком долго + выполняется JavaScript. Выглядит это примерно так: +
+
+ this.timings['look-ma-im-start'] = Date.now();
+
+ this.timings['look-ma-finish'] = Date.now();
+
+ C помощью Date.now() мы получаем текущее время. Все тайминги собираются и при
+ отправке рассчитываются. На этапах разница между “end” и “start” не считается,
+ а все вычисления производятся в конце:
+
+
+ var totalTime = this.timings['look-ma-finish'] - this.timings['look-ma-im-start'];
+
+
+ И на сервер прилетают подобные записи: +
+
+ serverResponse=50&domUpdate=60
+
+
+
+ Как мы ускоряем +
++ Чтобы снизить время загрузки почты при выходе новых версий, + мы уже делаем следующее: +
-
+
- включаем gzip; +
- выставляем заголовки кэширования; +
- фризим CSS, JS, шаблоны и картинки; +
- используем CDN; +
+ Мы подумали: А что если хранить где-то старую версию файлов, а при выходе новой
+ передавать только diff между ней и той, которая сохранена у пользователя?
+ В браузере же останется просто наложить патч на клиенте.
+
+ На самое деле эта идея не нова. Уже существуют стандарты для HTTP — например, + RFC 3229 «Delta encoding in HTTP» и «Google + SDHC», — но по разным причинам они не получили должного распространения + в браузерах и на серверах. +
+ Мы же решили сделать свой аналог на JS. Чтобы реализовать этот метод обновления, + начали искать реализации diff на JS. На популярных хостингах кода нашли + библиотеки: +
-
+
- VCDiff +
- google-diff-patch-match +
Для окончательного выбора библиотеки нам нужно сравнить:
+
+
| Библиотека | +IE 9 | +Opera 12 | +
| vcdiff | +8 | +5 | +
| google diff | +1363 | +76 | +
+ После того как мы определились с библиотекой для диффа, нужно определиться с тем, + где и как хранить статику на клиенте. +
+ Формат файла с патчами для проекта выглядит так:
+
+
+ [
+
+ {
+ "k": "jane.css",
+ "p": [patch],
+ "s": 4554
+ },
+ {
+ "k": "jane.css",
+ "p": [patch],
+ "s": 4554
+ }
+ ]
+
+ То есть это обычный массив из объектов. Каждый объект — отдельный ресурс. У
+ каждого объекта есть три свойства. k — названия ключа в localStorage для этого
+ ресурса. p — патч для ресурса, который сгенерировал vcdiff. s — чексумма для
+ ресурса актуальной версии, чтобы потом можно было проверить правильность
+ наложения патча на клиенте. Чексумма вычисляется по алгоритму Флетчера.
+
+ Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS)
+ — итерационный метод численной оптимизации, предназначенный для
+ нахождения локального максимума/минимума нелинейного функционала
+ без ограничений.
+
+
+ Почему именно алгоритм Флетчера, а не другие популярные алгоритмы вроде:
+
-
+
- + CRC16/32 - алгоритм нахождения контрольной суммы, предназначенный для проверки + целостности данных + +
- + md5 - 128-битный алгоритм хеширования. Предназначен для создания «отпечатков» + +
- + или дайджестов сообщения произвольной длины и последующей проверки их подлинности. + +
+ Потому что он быстрый, компактный и легок в реализации. +
+ Итог +
+
+ Фактически мы экономим 80-90% трафика. Размер загружаемой статитки в байтах:
+
+
| Релиз | +С патчем | +Без патча | +
| 7.7.20 | +397 | +174 549 | +
| 7.7.21 | +383 | +53 995 | +
| 7.7.22 | +483 | +3 995 | +
+