ЛМС ЯНДЕКС задача Препринты
Ограничение времени1 секундаОграничение памяти64 МбВводстандартный ввод или arxiv.zipВыводстандартный вывод или annotations.txt
Разработчики не только разрабатывают прикладные приложения, среди них есть учёные, которые, например, создают Большие Языковые Модели, чтобы ваш ИИ-бот мог быстро и правильно отвечать на вопросы.
Среди учёных (и не только разработчиков Яндекса) распространена практика выкладывать свои научные работы в общий доступ до того, как серьёзные научные журналы проведут экспертизу и опубликуют работу на своих страницах. Это приносит пользу и самим учёным — коллеги могут вовремя заметить недостатки и покритиковать работу, в результате её можно улучшить или дополнить, — и всем, кто интересуется наукой — можно быть в курсе событий на самом переднем крае новых исследований.
Напишите программу, которая откроет архив таких препринтов arxiv.zip и соберёт аннотации из записанных в нём файлов txt.
В файл annotations.txt запишите первые три абзаца — название, авторы, затем пропустите заголовок Abstract (он может быть написан в разных регистрах) и возьмите аннотацию — из каждого файла архива в порядке фамилии первого автора (вторая строка файла). Работы разделяйте пустой строкой.
Если будете в процессе работы использовать временные папки, не забудьте их удалить.
Архив из примера можно скачать по ссылке.
В примере будет получен файл annotations.txt с таким содержимым:
Behind the Noise: Conformal Quantile Regression Reveals Emergent Representations
Petrus H. Zwart, Tamas Varga, Odeta Qafoku, James A. Sethian
Scientific imaging often involves long acquisition times to obtain high-quality data, especially when probing complex, heterogeneous systems.
BAT: Benchmark for Auto-bidding Task
Alexandra Khirianova, Ekaterina Solodneva, Andrey Pudovikov, Sergey Osokin, Egor Samosvat, Yuriy Dorn, Alexander Ledovsky, Yana Zenkova
The optimization of bidding strategies for online advertising slot auctions presents a critical challenge across numerous digital marketplaces.
EVALUATING LLM METRICS THROUGH REAL-WORLD CAPABILITIES
Justin K. Miller, Wenjia Tang
As generative AI becomes increasingly embedded in everyday workflows, it is important to evaluate its performance in ways that reflect real-world usage rather than abstract notions of intelligence.