Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

Для чего нужно разбивать данные на обучающую и тестовую выборку?

Алина Макеева Ученик (85), открыт 3 недели назад
Для чего нужно разбивать данные на обучающую и тестовую выборку?
1)Для постепенного обучения алгоритма: наилучшее качество обычно достигается при обучении алгоритма на среднем объеме данных, можно начать с небольшой обучающей выборки, и если ошибка алгоритма будет большой, то добавить объекты из тестовой выборки
2)Для сокращения времени обучения алгоритма: чем меньше обучающих данных, тем быстрее происходит обучение алгоритма
3)Для контроля качества: если алгоритм часто ошибается на тестовой выборке м практически не ошибается на обучающей выборке, это означает, что он просто *запомнил” ответы на обучающей выборке, не найдя зависимостей в данных, такой алгоритм нужно доработать
1 ответ
baxbax777 Мастер (2498) 3 недели назад
3, но исходя из опыта, скажу, что не всегда нужно делить данные. Как правило, их не так много, и лучше пустить их на обучение, особенно если умеешь правильно строить архитектуру моделей.
Похожие вопросы