diff --git a/README.md b/README.md index fa0397238f23213ea4a4e1d35ccf989b8acad22c..89d87e8931e1c90eab07375792c2c6bbbd90f7d8 100644 --- a/README.md +++ b/README.md @@ -12,9 +12,9 @@ Kодировщик использует LSTM для вычисления век В качестве ААК используется реализация из https://github.com/nayuki/Reference-arithmetic-coding Параметры бейзлайна: -| Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с | -|:------:|:----------------------:|:--------------------------:|:------------------:|:------------------:| -| Baseline | 100000 | 38283 | 2.63 | 296 | +| Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с | + +| Baseline | 100000 | 38283 | 2.63 | 296 | ## Описание задания к лабораторной работе @@ -23,14 +23,14 @@ Kодировщик использует LSTM для вычисления век - либо обеспечивал **улучшение коэффициента сжатия на 30%** при **тех же временных затратах**. Можно улучшать следующие модули: -- Предобработка: заменять слова из предварительно созданного словаря уникальным кодом, использовать идею из Byte-Pair Encoding токенизации и т.д.; -- Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), изменить функции активации, связи между слоями и т.д.; -- Арифметический кодер: учесть возможную память источника, оценка вероятностей и т.д. +- Предобработка: замена слова из предварительно созданного словаря уникальным кодом, использование идеи из Byte-Pair Encoding токенизации и т.д.; +- Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), другой функции активации, изменениями связей между слоями и т.д.; +- Арифметический кодер: можно учесть возможную память источника, использовать другую оценку вероятностей и т.д. Требования к реализации: - Результаты должны быть продемонстрированы на enwik5 из папки ./data/; - Восстановленый после сжатия файл должен полностью совпадать с оригинальным; -- В результатах приложить таблицу выше, **обновив значения базового решения для вашего устройства** и добавив строчку с улучшенным решением. +- В результатах приложить таблицу выше, обновив значения базового решения для вашего устройства и добавив строчку с улучшенным решением. - Измерения времени кодирования и декодирования базовой и предложенной версии должны быть выполнены на одном и том же устройстве. На почту eabelyaev@itmo.ru прислать отчёт в виде презентации в pdf формате, который включает в себя: