Commit 281eca72 authored by Evgeny Belyaev's avatar Evgeny Belyaev

Исправил readme

parent b5514f29
...@@ -13,7 +13,7 @@ Kодировщик использует LSTM для вычисления век ...@@ -13,7 +13,7 @@ Kодировщик использует LSTM для вычисления век
Параметры бейзлайна: Параметры бейзлайна:
| Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с | | Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с |
|:------:|:----------------------:|:--------------------------:|:------------------:|:------------------:|
| Baseline | 100000 | 38283 | 2.63 | 296 | | Baseline | 100000 | 38283 | 2.63 | 296 |
...@@ -23,14 +23,14 @@ Kодировщик использует LSTM для вычисления век ...@@ -23,14 +23,14 @@ Kодировщик использует LSTM для вычисления век
- либо обеспечивал **улучшение коэффициента сжатия на 30%** при **тех же временных затратах**. - либо обеспечивал **улучшение коэффициента сжатия на 30%** при **тех же временных затратах**.
Можно улучшать следующие модули: Можно улучшать следующие модули:
- Предобработка: заменять слова из предварительно созданного словаря уникальным кодом, использовать идею из Byte-Pair Encoding токенизации и т.д.; - Предобработка: замена слова из предварительно созданного словаря уникальным кодом, использование идеи из Byte-Pair Encoding токенизации и т.д.;
- Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), изменить функции активации, связи между слоями и т.д.; - Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), другой функции активации, изменениями связей между слоями и т.д.;
- Арифметический кодер: учесть возможную память источника, оценка вероятностей и т.д. - Арифметический кодер: можно учесть возможную память источника, использовать другую оценку вероятностей и т.д.
Требования к реализации: Требования к реализации:
- Результаты должны быть продемонстрированы на enwik5 из папки ./data/; - Результаты должны быть продемонстрированы на enwik5 из папки ./data/;
- Восстановленый после сжатия файл должен полностью совпадать с оригинальным; - Восстановленый после сжатия файл должен полностью совпадать с оригинальным;
- В результатах приложить таблицу выше, **обновив значения базового решения для вашего устройства** и добавив строчку с улучшенным решением. - В результатах приложить таблицу выше, обновив значения базового решения для вашего устройства и добавив строчку с улучшенным решением.
- Измерения времени кодирования и декодирования базовой и предложенной версии должны быть выполнены на одном и том же устройстве. - Измерения времени кодирования и декодирования базовой и предложенной версии должны быть выполнены на одном и том же устройстве.
На почту eabelyaev@itmo.ru прислать отчёт в виде презентации в pdf формате, который включает в себя: На почту eabelyaev@itmo.ru прислать отчёт в виде презентации в pdf формате, который включает в себя:
......
Markdown is supported
0%
or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment