Timeline Self-Reflection for Improved Temporal Reasoning in Language Models
Временное самоотражение для логических моделей Документ представляет собой научную статью, посвященную TISER, новой системе, предназначенной для улучшения временного мышления в больших языковых моделях (БЯМ). Система TISER использует многоступенчатый процесс, включающий построение временной шкалы и итеративную саморефлексию во время вывода, чтобы повысить точность рассуждений БЯМ о последовательности и продолжительности событий. Авторы демонстрируют, что, используя стратегию TISER для точной настройки, даже меньшие модели с открытым исходным кодом, такие как Mistral-7B и Qwen2.5-7B, могут достигать или превосходить производительность более крупных закрытых моделей, таких как GPT-4o, в различных тестах на временное мышление. В статье подробно описываются четыре этапа этого процесса (рассуждение, построение временной шкалы, рефлексия и генерация ответа), а также проводится абляционное исследование, подтверждающее важность каждого компонента. #amazon документ - https://arxiv.org/pdf/2504.05258 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
Временное самоотражение для логических моделей Документ представляет собой научную статью, посвященную TISER, новой системе, предназначенной для улучшения временного мышления в больших языковых моделях (БЯМ). Система TISER использует многоступенчатый процесс, включающий построение временной шкалы и итеративную саморефлексию во время вывода, чтобы повысить точность рассуждений БЯМ о последовательности и продолжительности событий. Авторы демонстрируют, что, используя стратегию TISER для точной настройки, даже меньшие модели с открытым исходным кодом, такие как Mistral-7B и Qwen2.5-7B, могут достигать или превосходить производительность более крупных закрытых моделей, таких как GPT-4o, в различных тестах на временное мышление. В статье подробно описываются четыре этапа этого процесса (рассуждение, построение временной шкалы, рефлексия и генерация ответа), а также проводится абляционное исследование, подтверждающее важность каждого компонента. #amazon документ - https://arxiv.org/pdf/2504.05258 подписаться - https://t.me/arxivpaperu отправить донаты: USDT: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 BTC: bc1q8972egrt38f5ye5klv3yye0996k2jjsz2zthpr ETH: 0xAA7B976c6A9A7ccC97A3B55B7fb353b6Cc8D1ef7 SOL: DXnz1nd6oVm7evDJk25Z2wFSstEH8mcA1dzWDCVjUj9e создано с помощью NotebookLM
