sentence-transformers로 RAG 임베딩 직접 실험하기 — 한국어 쿼리 정확도가 67% 떨어지는 이유
all-MiniLM-L6-v2를 로컬에서 설치해 코사인 유사도, 미니 RAG, 다국어 모델 비교까지 직접 측정했다. 영어 최적화 임베딩 모델로 한국어 RAG를 구축하면 정확도가 67% 하락한다는 실측 결과와 해결책을 공유한다.
jangwook.net
Personal technical notes on AI agents, automation, developer tools, and the process of building software.
Latest Notes
The root page stays intentionally small. Choose a language, then read the full archive and related posts there.
AI 에이전트, 자동화, 개발 도구, 소프트웨어 제작 과정을 한국어로 기록합니다.
all-MiniLM-L6-v2를 로컬에서 설치해 코사인 유사도, 미니 RAG, 다국어 모델 비교까지 직접 측정했다. 영어 최적화 임베딩 모델로 한국어 RAG를 구축하면 정확도가 67% 하락한다는 실측 결과와 해결책을 공유한다.
InsightForge가 무엇인지, 왜 만들었는지를 솔직하게 정리했다. synthetic panel과 SSR 방법론으로 소비자 리서치 자동화를 구현하면서 겪은 시행착오, 그리고 AI를 검증 우선순위 결정 도구로 재정의하기까지의 핵심 설계 원칙과 기술적 선택을 공유한다.
Mastra.ai TypeScript AI 에이전트 프레임워크를 직접 설치하고 Google Gemini와 연동해 날씨 에이전트를 만들어봤다. 설치부터 실제 툴 호출까지 실습 기록.
Personal notes on AI agents, automation, developer tools, and building software.
I installed all-MiniLM-L6-v2 locally and measured cosine similarity, ran a mini RAG simulation, and compared English vs multilingual embedding models. The accuracy gap with Korean queries was bigger than expected — here are the actual logs.
A founder-style build log about what InsightForge is, why I built it, and the hard parts of turning synthetic panels and SSR-style research into a responsible product.
I installed Mastra.ai TypeScript agent framework, connected it to Google Gemini, and built a working weather agent. Here's what happened — from setup to actual tool calls.
AIエージェント、自動化、開発ツール、ソフトウェア開発の記録です。
all-MiniLM-L6-v2をローカルで動かし、コサイン類似度・ミニRAG・多言語モデル比較まで直接測定した。英語最適化の 埋め込みモデルで韓国語RAGを構築すると精度が67%低下するという実測結果と解決策を共有する。
InsightForgeとは何か、なぜ作ったのか、synthetic panelとSSR的な方法論を責任あるプロダクトにする中で苦労した点をまとめました。
Mastra.ai TypeScript AIエージェントフレームワークを実際にインストールしてGoogle Geminiと連携し、天気エージェントを作ってみた。インストールから実際のツール呼び出しまでの実験記録。
记录 AI 代理、自动化、开发工具和软件构建过程。
在本地安装all-MiniLM-L6-v2,直接测量余弦相似度、运行迷你RAG,并比较英语与多语言嵌入模型。 用英语优化模型构建韩语RAG系统时,准确率下降67%的实测结果与解决方案。
这是一篇产品构建记录,说明InsightForge是什么、为什么要做,以及把synthetic panel和SSR式方法做成负责任产品时遇到的困难。
我亲自安装了Mastra.ai TypeScript AI代理框架,将其连接到Google Gemini并构建了一个天气代理。从安装到实际工具调用的完整实验记录。