From 281eca72125630c1fecc599197496d654d64b851 Mon Sep 17 00:00:00 2001 From: eabelyaev Date: Mon, 10 Nov 2025 13:51:59 +0300 Subject: [PATCH] =?UTF-8?q?=D0=98=D1=81=D0=BF=D1=80=D0=B0=D0=B2=D0=B8?= =?UTF-8?q?=D0=BB=20readme?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 14 +++++++------- 1 file changed, 7 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index fa03972..89d87e8 100644 --- a/README.md +++ b/README.md @@ -12,9 +12,9 @@ Kодировщик использует LSTM для вычисления век В качестве ААК используется реализация из https://github.com/nayuki/Reference-arithmetic-coding Параметры бейзлайна: -| Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с | -|:------:|:----------------------:|:--------------------------:|:------------------:|:------------------:| -| Baseline | 100000 | 38283 | 2.63 | 296 | +| Версия | Исходный размер, байты | Размер после сжатия, байты | Коэффициент сжатия | Затраченное время, с | + +| Baseline | 100000 | 38283 | 2.63 | 296 | ## Описание задания к лабораторной работе @@ -23,14 +23,14 @@ Kодировщик использует LSTM для вычисления век - либо обеспечивал **улучшение коэффициента сжатия на 30%** при **тех же временных затратах**. Можно улучшать следующие модули: -- Предобработка: заменять слова из предварительно созданного словаря уникальным кодом, использовать идею из Byte-Pair Encoding токенизации и т.д.; -- Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), изменить функции активации, связи между слоями и т.д.; -- Арифметический кодер: учесть возможную память источника, оценка вероятностей и т.д. +- Предобработка: замена слова из предварительно созданного словаря уникальным кодом, использование идеи из Byte-Pair Encoding токенизации и т.д.; +- Нейронная сеть: использование другой архитектуры (GRU, Transformer и др.), другой функции активации, изменениями связей между слоями и т.д.; +- Арифметический кодер: можно учесть возможную память источника, использовать другую оценку вероятностей и т.д. Требования к реализации: - Результаты должны быть продемонстрированы на enwik5 из папки ./data/; - Восстановленый после сжатия файл должен полностью совпадать с оригинальным; -- В результатах приложить таблицу выше, **обновив значения базового решения для вашего устройства** и добавив строчку с улучшенным решением. +- В результатах приложить таблицу выше, обновив значения базового решения для вашего устройства и добавив строчку с улучшенным решением. - Измерения времени кодирования и декодирования базовой и предложенной версии должны быть выполнены на одном и том же устройстве. На почту eabelyaev@itmo.ru прислать отчёт в виде презентации в pdf формате, который включает в себя: -- GitLab