Тезисы
Поговорим о том, почему информация о килобайтах в бандле в среднем более чем бесполезна при внесении изменений в кодовую базу проекта.
Постараюсь доказать, что webpack-bundle-analyzer и ещё с десяток популярных плагинов, которые советуют в чатиках, не дают ничего, кроме поверхностной картины.
Поищем клоны и копипасты в коде при помощи текстового и структурного анализа на Python. Начем с азов анализа текста (shingles + jaccard distance + tfidf и т.д.), далее рассмотрим современные и эффективные алгоритмы для решения данной задачи (minhash + LSH). А также посмотрим на практике, как данный анализ может помочь уменьшить размер бандла.
Аудитория и уровень
Фронтенд разработчики с широким кругозором :)
Презентация (на Я.Диске)
Учусь в ШАД. Работаю над Яндекс.Маркетом. Интересуюсь темой code mining.