Llama.cpp: различия между версиями

Версия от 10:31, 28 июля 2025

llama.cpp

Библиотека для инференса LLM.

Язык программирования:: C++, C и C++, C

Разработчик:: Георгий Герганов и сообщество

Дата появления:: март 10, 2023; 2 years ago (2023-03-10)^[1]

Лицензия:: MIT License^[2]

Шаблон: п·о·и

Форма: о·с

со строчной буквы

llama.cpp — это библиотека с открытым исходным кодом, которая выполняет инференс с использованием различных больших языковых моделей, таких как Llama^[3].

Она разрабатывается совместно с проектом GGML, тензорной библиотекой общего назначения^[4].

В состав библиотеки входят инструменты командной строки, а также сервер с простым веб-интерфейсом^[5].

Предыстория

В конце сентября 2022 года Георгий Герганов начал работу над библиотекой GGML, библиотекой на языке C, реализующей тензорную алгебру. Герганов разрабатывал библиотеку с учётом строгого управления памятью и многопоточности. Создание GGML было вдохновлено работой Фабриса Беллара над LibNC[8]. До llama.cpp Герганов работал над аналогичной библиотекой whisper.cpp, которая реализовала Whisper — модель преобразования речи в текст от OpenAI[9].

Примечания

↑ Ошибка цитирования Неверный тег <ref>; для сносок githubrelease не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок license не указан текст
↑ Connatser, Matthew. How this open source LLM chatbot runner hit the gas on x86, Arm CPUs (неопр.). theregister.com. Дата обращения: 15 апреля 2024.
↑ Gerganov, Georgi. ggerganov/ggml (неопр.). GitHub (17 мая 2024).
↑ Mann, Tobias. Intro to speculative decoding: Cheat codes for faster LLMs (англ.). theregister (15 декабря 2024).

[githubrelease-1] Ошибка цитирования Неверный тег <ref>; для сносок githubrelease не указан текст

[license-2] Ошибка цитирования Неверный тег <ref>; для сносок license не указан текст

[register-llamafile-3] Connatser, Matthew. How this open source LLM chatbot runner hit the gas on x86, Arm CPUs (неопр.). theregister.com. Дата обращения: 15 апреля 2024.

[ggml-4] Gerganov, Georgi. ggerganov/ggml (неопр.). GitHub (17 мая 2024).

[theregister_15_December_2024-5] Mann, Tobias. Intro to speculative decoding: Cheat codes for faster LLMs (англ.). theregister (15 декабря 2024).

[1]

[2]

[3]

[4]

[5]

@@ Строка 17: / Строка 17: @@
 В состав библиотеки входят инструменты командной строки, а также сервер с простым веб-интерфейсом<ref name="theregister 15 December 2024">{{cite web |last1=Mann |first1=Tobias |title=Intro to speculative decoding: Cheat codes for faster LLMs |url=https://www.theregister.com/2024/12/15/speculative_decoding/ |website=theregister |language=en |date=15 December 2024}}</ref>.
+== Предыстория ==
+В конце сентября 2022 года [[Георгий Герганов]] начал работу над библиотекой [[GGML (библиотека машинного обучения)|GGML]], библиотекой на языке [[C (язык программирования)|C]], реализующей [[Тензорная алгебра|тензорную алгебру]]. Герганов разрабатывал библиотеку с учётом строгого управления памятью и [[Многопоточность|многопоточности]]. Создание GGML было вдохновлено работой [[Беллар, Фабрис|Фабриса Беллара]] над [[LibNC]][8]. До llama.cpp Герганов работал над аналогичной библиотекой [[whisper.cpp]], которая реализовала [[Whisper]] — [[модель преобразования речи в текст]] от [[OpenAI]][9].
 == Примечания ==
 [[Категория:Программное обеспечение для машинного обучения]]

Llama.cpp: различия между версиями

Версия от 10:31, 28 июля 2025

со строчной буквы

Предыстория

Примечания

Навигация

Поиск