'LLM' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2026/05 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

목록LLM (3)

GW LABS

읽은 글을 기억으로: 서버비 0원의 온디바이스 AI 퀴즈 앱 'Blank.' 개발기

우리는 매일 수많은 아티클과 뉴스레터를 읽습니다. 하지만 다음 날이면 내용이 가물가물해지곤 합니다. ‘스크랩만 해두고 다시 보지 않는 글들을 강제로 복습하게 만들 순 없을까?’ 이 작은 고민에서 출발한 앱, Blank.의 개발 과정을 공유합니다. Blank는 링크만 넣으면 AI가 핵심을 파악해 빈칸 채우기(Cloze Test) 문제를 만들어주는 안드로이드 앱입니다.1. 왜 서버가 아니라 기기 내부(On-device)를 선택했나개인화된 학습 도구를 만들 때 가장 큰 고민은 두 가지였습니다. 첫째는 트래픽에 비례해 증가하는 유지보수 비용(서버비)이었고, 둘째는 사용자가 어떤 글을 읽는지에 대한 프라이버시 문제였습니다. 이를 해결하기 위해 서버 기반의 API 대신 기기 내부에서 직접 AI를 구동하는 방식을 택..

Programming 2026. 2. 23. 21:21

Gemma3 270M으로 배우는 sLLM 파인튜닝과 Edge Device 서빙 전략

서론최근 LLM(Large Language Model)의 경량화 버전인 sLLM(Small Language Model) 이 빠르게 주목받고 있습니다. 거대한 모델을 직접 서빙하기 어려운 환경에서는 sLLM과 같은 소형 모델을 적절히 파인튜닝해 활용하는 것이 매우 유효한 전략입니다. 본 포스팅에서는 Gemma3 270M 모델을 활용하여 LoRA 기반 파인튜닝을 진행하고, 학습된 PyTorch 모델을 TensorFlow Lite 변환 후 Mediapipe 기반 Edge Device 서빙까지 이어지는 전체 워크플로우를 정리합니다. 이 글은 실무 환경에서 sLLM을 파인튜닝하거나 모바일·엣지 디바이스에 배포하려는 개발자에게 최적화된 가이드를 제공합니다. 본론1. Gemma3 270M과 sLLM 파인튜닝Gem..

MachineLearning 2025. 9. 2. 08:53

오픈소스 GraphRAG 'Graphiti'

오픈소스 GraphRAG 'Graphiti'란? AI 기반 RAG 구축에 최적의 선택소개AI 기술이 발전하면서 RAG(Retrieval-Augmented Generation)는 더 이상 선택이 아닌 필수가 되고 있습니다. 하지만 일반적인 RAG 파이프라인은 텍스트 기반의 벡터 검색에만 의존하여, 정보 간 관계성을 놓치는 한계를 가지고 있죠.이런 문제를 해결하기 위해 등장한 것이 바로 오픈소스 GraphRAG 프로젝트인 Graphiti입니다.이 글에서는 주니어 개발자와 AI 개발자를 위한 Graphiti의 개념, 아키텍처, 사용법을 친절하게 소개합니다. 특히 GraphRAG 기반 지식 그래프 구축법과 코드 예제를 통해, 실전에서 바로 활용할 수 있도록 도와드립니다.본문1. GraphRAG란 무엇인가?RAG..

Journal/About Tech 2025. 8. 7. 21:18

Prev 1 Next

목록LLM (3)

GW LABS

티스토리툴바