Top.Mail.Ru

Data Science на Javascript модулях
Frontend

Зал №5

Тезисы

Поговорим о том, почему информация о килобайтах в бандле в среднем более чем бесполезна при внесении изменений в кодовую базу проекта.

Постараюсь доказать, что webpack-bundle-analyzer и ещё с десяток популярных плагинов, которые советуют в чатиках, не дают ничего, кроме поверхностной картины.

Поищем клоны и копипасты в коде при помощи текстового и структурного анализа на Python. Начем с азов анализа текста (shingles + jaccard distance + tfidf и т.д.), далее рассмотрим современные и эффективные алгоритмы для решения данной задачи (minhash + LSH). А также посмотрим на практике, как данный анализ может помочь уменьшить размер бандла.

Аудитория и уровень

Фронтенд разработчики с широким кругозором :)

Презентация (на Я.Диске)

Фан-чат CodeFest

Запись доклада

Яндекс

Никита Сидоров

Учусь в ШАД. Работаю над Яндекс.Маркетом. Интересуюсь темой code mining.

Учусь в ШАД. Работаю над Яндекс.Маркетом. Интересуюсь темой code mining.

Другие спикеры секции Frontend