Трансформер (модель машинного обучения): различия между версиями

Версия от 16:05, 4 ноября 2020

У этого термина существуют и другие значения, см. Трансформер.

Трансфо́рмер (англ. Transformer) — архитектура глубоких нейронных сетей, представленная в 2017 году исследователями из Google Brain.^[1]

По аналогии с рекуррентными нейронными сетями (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как машинный перевод и автоматическое реферирование. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры распараллеливаются легче чем РНС и могут быть быстрее обучены.^[1]

Трансформеры используются в Яндекс.Переводчике^[2], Яндекс.Новостях^[3], Google Переводчике^[4], GPT-3.

Примечания

↑ ^1,0 ^1,1 Ошибка Lua в Модуль:Sources на строке 1705: attempt to index field 'wikibase' (a nil value).
↑ Семен Козлов. Transformer — новая архитектура нейросетей для работы с последовательностями (рус.). Хабр (30 октября 2017). Дата обращения: 3 ноября 2020.
↑ Тимур Гаскаров. Как Яндекс научил искусственный интеллект находить ошибки в новостях (рус.). Хабр (12 декабря 2019). Дата обращения: 3 ноября 2020.
↑ Isaac Caswell, Bowen Liang. Recent Advances in Google Translate (англ.). Google AI Blog (8 июня 2020). Дата обращения: 3 ноября 2020.

[paper-1] 1,0 ^1,1 Ошибка Lua в Модуль:Sources на строке 1705: attempt to index field 'wikibase' (a nil value).

[2] Семен Козлов. Transformer — новая архитектура нейросетей для работы с последовательностями (рус.). Хабр (30 октября 2017). Дата обращения: 3 ноября 2020.

[3] Тимур Гаскаров. Как Яндекс научил искусственный интеллект находить ошибки в новостях (рус.). Хабр (12 декабря 2019). Дата обращения: 3 ноября 2020.

[4] Isaac Caswell, Bowen Liang. Recent Advances in Google Translate (англ.). Google AI Blog (8 июня 2020). Дата обращения: 3 ноября 2020.

[1]

[2]

[3]

[4]

@@ Строка 2: / Строка 2: @@
 '''Трансфо́рмер''' ({{lang-en|Transformer}}) — архитектура [[Глубокое обучение|глубоких]] [[Нейронная сеть|нейронных сетей]], представленная в 2017 году исследователями из [[Google Brain]].<ref name="paper">{{source|Q30249683}}</ref>
-По аналогии с [[Рекуррентная нейронная сеть|рекуррентными нейронными сетями]] (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как [[машинный перевод]] и [[автоматическое реферирование]]. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Для примера, если входные данные это текст, трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры [[Параллельные вычисления|распараллеливаются]] легче чем РНС и могут быть быстрее обучены.<ref name="paper" />
+По аналогии с [[Рекуррентная нейронная сеть|рекуррентными нейронными сетями]] (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как [[машинный перевод]] и [[автоматическое реферирование]]. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры [[Параллельные вычисления|распараллеливаются]] легче чем РНС и могут быть быстрее обучены.<ref name="paper" />
 Трансформеры используются в [[Яндекс.Переводчик]]е<ref>{{cite web

Трансформер (модель машинного обучения): различия между версиями

Версия от 16:05, 4 ноября 2020

Примечания

Навигация

Поиск