Llama.cpp: различия между версиями

Версия от 01:31, 28 июля 2025

llama.cpp

Библиотека для инференса LLM.

Шаблон: п·о·и

Форма: о·с

llama.cpp — это библиотека с открытым исходным кодом, которая выполняет инференс с использованием различных больших языковых моделей, таких как Llama^[3].

В состав библиотеки входят инструменты командной строки, а также сервер с простым веб-интерфейсом^[5].

↑ Ошибка цитирования Неверный тег <ref>; для сносок githubrelease не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок license не указан текст
↑ Connatser, Matthew. How this open source LLM chatbot runner hit the gas on x86, Arm CPUs (неопр.). theregister.com. Дата обращения: 15 апреля 2024.
↑ Gerganov, Georgi. ggerganov/ggml (неопр.). GitHub (17 мая 2024).
↑ Mann, Tobias. Intro to speculative decoding: Cheat codes for faster LLMs (англ.). theregister (15 декабря 2024).

@@ Строка 1: / Строка 1: @@
 {{Infobox software
 | name = llama.cpp
-| logo = File:Llama1-logo.svg
+| logo = Llama1-logo.svg
 | author = [[Георгий Герганов]]
 | developer = Георгий Герганов и сообщество