Llama.cpp: различия между версиями
Перейти к навигации
Перейти к поиску
In.wiki (комментарии | вклад) |
In.wiki (комментарии | вклад) |
||
Строка 1: | Строка 1: | ||
{{Infobox software | {{Infobox software | ||
| name = llama.cpp | | name = llama.cpp | ||
− | | logo = | + | | logo = Llama1-logo.svg |
| author = [[Георгий Герганов]] | | author = [[Георгий Герганов]] | ||
| developer = Георгий Герганов и сообщество | | developer = Георгий Герганов и сообщество |
Версия от 01:31, 28 июля 2025
llama.cpp Библиотека для инференса LLM.
|
- Язык программирования:
- C++, C и C++, C
- Разработчик:
- Георгий Герганов и сообщество
- Дата появления:
- март 10, 2023[1]
со строчной буквы
llama.cpp — это библиотека с открытым исходным кодом, которая выполняет инференс с использованием различных больших языковых моделей, таких как Llama[3].
Она разрабатывается совместно с проектом GGML, тензорной библиотекой общего назначения[4].
В состав библиотеки входят инструменты командной строки, а также сервер с простым веб-интерфейсом[5].
Примечания
- ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокgithubrelease
не указан текст - ↑ Ошибка цитирования Неверный тег
<ref>
; для сносокlicense
не указан текст - ↑ Connatser, Matthew. How this open source LLM chatbot runner hit the gas on x86, Arm CPUs . theregister.com. Дата обращения: 15 апреля 2024.
- ↑ Gerganov, Georgi. ggerganov/ggml . GitHub (17 мая 2024).
- ↑ Mann, Tobias. Intro to speculative decoding: Cheat codes for faster LLMs (англ.). theregister (15 декабря 2024).