| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- VPC
- 머신러닝
- Docker
- gcp
- 로드밸런서
- Spring Data JPA
- aws
- 오일러프로젝트
- 클라우드 컴퓨팅
- 스프링부트
- Elasticsearch
- 카프카
- springboot
- 스프링
- 스프링 부트
- 백트래킹
- 백준
- DFS
- 프로그래밍문제
- Spring Boot
- Kafka
- JPA
- 클라우드
- 자료구조
- 알고리즘
- Spring
- 코드업
- Apache Kafka
- 개발
- 쿠버네티스
- Today
- Total
목록LLM (2)
GW LABS
서론최근 LLM(Large Language Model)의 경량화 버전인 sLLM(Small Language Model) 이 빠르게 주목받고 있습니다. 거대한 모델을 직접 서빙하기 어려운 환경에서는 sLLM과 같은 소형 모델을 적절히 파인튜닝해 활용하는 것이 매우 유효한 전략입니다. 본 포스팅에서는 Gemma3 270M 모델을 활용하여 LoRA 기반 파인튜닝을 진행하고, 학습된 PyTorch 모델을 TensorFlow Lite 변환 후 Mediapipe 기반 Edge Device 서빙까지 이어지는 전체 워크플로우를 정리합니다. 이 글은 실무 환경에서 sLLM을 파인튜닝하거나 모바일·엣지 디바이스에 배포하려는 개발자에게 최적화된 가이드를 제공합니다. 본론1. Gemma3 270M과 sLLM 파인튜닝Gem..
오픈소스 GraphRAG 'Graphiti'란? AI 기반 RAG 구축에 최적의 선택소개AI 기술이 발전하면서 RAG(Retrieval-Augmented Generation)는 더 이상 선택이 아닌 필수가 되고 있습니다. 하지만 일반적인 RAG 파이프라인은 텍스트 기반의 벡터 검색에만 의존하여, 정보 간 관계성을 놓치는 한계를 가지고 있죠.이런 문제를 해결하기 위해 등장한 것이 바로 오픈소스 GraphRAG 프로젝트인 Graphiti입니다.이 글에서는 주니어 개발자와 AI 개발자를 위한 Graphiti의 개념, 아키텍처, 사용법을 친절하게 소개합니다. 특히 GraphRAG 기반 지식 그래프 구축법과 코드 예제를 통해, 실전에서 바로 활용할 수 있도록 도와드립니다.본문1. GraphRAG란 무엇인가?RAG..