Llama.cpp

Материал из in.wiki

Перейти к навигации Перейти к поиску

llama.cpp — это библиотека с открытым исходным кодом, которая выполняет инференс с использованием различных больших языковых моделей, таких как Llama^[1].

Она разрабатывается совместно с проектом GGML, тензорной библиотекой общего назначения^[2].

В состав библиотеки входят инструменты командной строки, а также сервер с простым веб-интерфейсом^[3].

Примечания[править | править код]

↑ Connatser, Matthew. How this open source LLM chatbot runner hit the gas on x86, Arm CPUs (неопр.). theregister.com. Дата обращения: 15 апреля 2024.
↑ Gerganov, Georgi. ggerganov/ggml (неопр.). GitHub (17 мая 2024).
↑ Mann, Tobias. Intro to speculative decoding: Cheat codes for faster LLMs (англ.). theregister (15 декабря 2024).

Источник — https://in.wiki/w/index.php?title=Llama.cpp&oldid=1569951

Категории:

Реклама: