#vllm
Узнайте все о vLLM: от методов ускорения и оптимизации больших языковых моделей до их применения в реальных задачах. В подборке – статьи о создании автономных ИИ-ассистентов для data science, кешировании и повышении производительности инференса для ваших проектов.
Сортировать по:
2216
1368
4295
700
1032
185
4372
339
2123
243
5571
424
Python
2 недели назад
LMCache — Turbo-режим для вашего LLM
Как ускорить работу LLM в 3-10 раз с помощью кэширования KV-кэшей? Обзор LMCache — революционного решения для оптимизации работы языковых моделей.
8369
1206
Jupyter Notebook
3 недели назад
Llama Cookbook - Ваш шеф-повар в мире больших языковых моделей
Погрузитесь в мир Llama с официальным Llama Cookbook от Meta! Это ваш незаменимый гид по инференсу, тонкой настройке и созданию полноценных LLM-прилож...
18333
2732
735
185