Наборы данных для обучения систем искусственного интеллекта
![]() |
Это незавершённая статья. Вы можете помочь проекту, исправив и дополнив её. |
Эти наборы данных используются в исследованиях машинного обучения (МО) и цитируются в рецензируемых научных журналах. Наборы данных являются неотъемлемой частью области машинного обучения. Значительные достижения в этой области могут быть обусловлены достижениями в алгоритмах обучения (таких как глубокое обучение), компьютерном оборудовании и, что менее очевидно, доступностью высококачественных обучающих наборов данных[1].
Высококачественные размеченные обучающие наборы данных для алгоритмов машинного обучения с учителем и частичным привлечением учителя обычно сложно и дорого создавать из-за большого количества времени, необходимого для разметки данных. Хотя разметка не требуется, высококачественные наборы данных для неконтролируемого обучения также могут быть сложными и дорогими[2][3][4].
Ссылки[править | править код]
Примечания[править | править код]
- ↑ Wissner-Gross, A. Datasets Over Algorithms . Edge.com. Дата обращения: 8 января 2016.
- ↑ Weiss, G. M.; Provost, F. (October 2003). "Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction". Journal of Artificial Intelligence Research. 19: 315–354. doi:10.1613/jair.1199.
- ↑ Weiss, G. M.; Provost, F. (October 2003). "Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction". Journal of Artificial Intelligence Research. 19: 315–354. doi:10.1613/jair.1199.
- ↑ Žliobaitė, Indrė. Active Learning with Evolving Streaming Data // Machine Learning and Knowledge Discovery in Databases / Indrė Žliobaitė, Albert Bifet, Bernhard Pfahringer … [и др.]. — 2011. — Vol. 6913. — P. 597–612. — ISBN 978-3-642-23807-9. — doi:10.1007/978-3-642-23808-6_39.