Наборы данных для обучения систем искусственного интеллекта

Материал из in.wiki
Перейти к навигации Перейти к поиску
800px-T64 and pencil.jpg Это незавершённая статья.
Вы можете помочь проекту, исправив и дополнив её.

Эти наборы данных используются в исследованиях машинного обучения (МО) и цитируются в рецензируемых научных журналах. Наборы данных являются неотъемлемой частью области машинного обучения. Значительные достижения в этой области могут быть обусловлены достижениями в алгоритмах обучения (таких как глубокое обучение), компьютерном оборудовании и, что менее очевидно, доступностью высококачественных обучающих наборов данных[1].

Высококачественные размеченные обучающие наборы данных для алгоритмов машинного обучения с учителем и частичным привлечением учителя обычно сложно и дорого создавать из-за большого количества времени, необходимого для разметки данных. Хотя разметка не требуется, высококачественные наборы данных для неконтролируемого обучения также могут быть сложными и дорогими[2][3][4].

Ссылки[править | править код]

Примечания[править | править код]

  1. Wissner-Gross, A. Datasets Over Algorithms. Edge.com. Дата обращения: 8 января 2016.
  2. Weiss, G. M.; Provost, F. (October 2003). "Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction". Journal of Artificial Intelligence Research. 19: 315–354. doi:10.1613/jair.1199.
  3. Weiss, G. M.; Provost, F. (October 2003). "Learning When Training Data are Costly: The Effect of Class Distribution on Tree Induction". Journal of Artificial Intelligence Research. 19: 315–354. doi:10.1613/jair.1199.
  4. Žliobaitė, Indrė. Active Learning with Evolving Streaming Data // Machine Learning and Knowledge Discovery in Databases / Indrė Žliobaitė, Albert Bifet, Bernhard Pfahringer … [и др.]. — 2011. — Vol. 6913. — P. 597–612. — ISBN 978-3-642-23807-9. — doi:10.1007/978-3-642-23808-6_39.