AI
-
EXAONE 4.5: LG의 첫 오픈웨이트 비전-언어 모델 완전 분석 (2026)AI 2026. 4. 9. 21:41
산업 현장에서 계약서, 기술 도면, 재무제표를 AI로 분석하고 싶었지만, 기존 텍스트 중심 LLM으로는 한계가 명확했어요. 2026년 4월 9일, LG AI연구원이 공개한 **EXAONE 4.5**는 바로 이 문제를 정면으로 겨냥한 비전-언어 모델(VLM)이에요. 자체 개발한 비전 인코더(Vision Encoder)와 EXAONE 4.0 LLM을 하나의 구조로 통합해, 텍스트와 이미지를 동시에 이해하고 추론하는 능력을 갖췄어요. 특히 330억(33B) 파라미터라는 비교적 컴팩트한 크기로 글로벌 톱티어 모델들을 벤치마크에서 앞서는 점이 인상적이에요. 이 글에서는 아키텍처, 벤치마크 성능, 그리고 실제 배포 방법까지 개발자 관점에서 핵심을 짚어볼게요.## 아키텍처: 네이티브 멀티모달과 하이브리드 어텐션**E..
-
Managed Agents 아키텍처: 브레인과 핸즈를 분리하는 확장 전략AI 2026. 4. 9. 21:25
에이전트(Agent) 시스템을 프로덕션에 올려본 개발자라면 누구나 한 번쯤 이런 문제를 겪어요. 컨테이너가 죽으면 세션이 날아가고, 디버깅하려면 유저 데이터가 있는 컨테이너에 직접 셸을 열어야 하고, 샌드박스에서 실행되는 코드가 크리덴셜에 접근할 수 있는 보안 구멍이 생기죠. Anthropic 엔지니어링 팀이 Managed Agents를 구축하면서 마주한 문제가 정확히 이것이었고, 그들이 찾은 해법은 "브레인(brain)과 핸즈(hands)의 분리"라는 아키텍처 원칙이에요. 이 글에서는 그 설계 결정의 배경과 구현 디테일, 그리고 우리가 에이전트 시스템을 설계할 때 가져갈 수 있는 인사이트를 정리해 볼게요.왜 모놀리식 에이전트 컨테이너는 한계에 부딪히는가초기 Managed Agents 설계에서는 세션(s..
-
AI 생성 코드 보안: PR의 87%에서 취약점이 발견되는 이유와 대응법AI 2026. 4. 8. 22:25
AI 코딩 어시스턴트의 생산성은 이미 검증됐지만, 보안 측면에서는 심각한 문제가 드러나고 있어요. Stanford 대학의 2023년 연구에 따르면 AI 생성 코드를 사용한 개발자들이 수동으로 작성한 개발자보다 더 취약한 코드를 만들면서도, 본인의 코드가 안전하다고 더 확신했다고 해요. Snyk의 조사에서도 AI가 제안하는 코드의 약 80% 이상에서 입력값 검증 누락, 하드코딩된 인증정보, 인증 체크 부재 같은 교과서적인 취약점이 발견됐어요. 이 글에서는 AI 생성 코드가 왜 취약한지, 어떤 패턴이 반복되는지, 그리고 개발자로서 어떻게 대응해야 하는지를 구체적으로 다뤄볼게요.AI가 취약한 코드를 만드는 구조적 원인AI 코딩 모델은 GitHub의 공개 저장소를 학습 데이터로 사용해요. 문제는 공개 코드의 대..
-
AI 생성 코드 탐지: 개발자가 알아야 할 164가지 시그널과 도구AI 2026. 4. 8. 22:05
프로덕션에 배포된 코드에서 console.log가 발견되거나, 페이지 타이틀이 여전히 "Create Next App"이라면 어떨까요? 이런 흔적은 단순한 실수가 아니라 AI 생성 코드 탐지의 핵심 시그널이에요. AI 코딩 도구가 보편화되면서, 사람의 리뷰 없이 그대로 배포되는 코드가 늘어나고 있어요. 문제는 이런 코드가 보안 취약점과 직결된다는 점이에요. 이 글에서는 AI가 만든 코드와 콘텐츠를 식별하는 164가지 시그널을 카테고리별로 분석하고, 실무에서 바로 활용할 수 있는 탐지 전략을 공유할게요.AI 생성 코드가 위험한 이유AI 생성 코드 탐지가 중요한 이유는 단순히 "AI를 썼느냐"를 판단하려는 게 아니에요. 핵심은 충분한 리뷰 없이 배포된 코드를 찾아내는 거예요. AI 도구가 생성한 코드는 기본 ..
-
gemma4 vllm 실행 방법: 최신 설치부터 서버 구성까지AI 2026. 4. 6. 22:15
LLM 서빙 환경을 직접 구축하려고 하면 가장 먼저 부딪히는 문제는 “최신 모델을 안정적으로 어떻게 띄우는가”예요. 특히 Google의 최신 오픈 모델인 gemma4 vllm 실행 방법은 출시 직후 빠르게 변하는 생태계 때문에 정보가 분산되어 있어요. 최근 vLLM에서 Gemma 4를 Day-0 지원하면서 상황이 크게 개선됐고, 이제는 비교적 간단한 명령어로 고성능 추론 서버를 구축할 수 있어요. 이 글에서는 설치부터 실행, 그리고 실제 운영 환경에서 필요한 최적화까지 한 번에 정리해볼게요.gemma4 vllm 실행을 위한 환경 준비Gemma 4는 텍스트뿐 아니라 이미지, 오디오까지 처리하는 멀티모달 모델이에요. vLLM은 이러한 구조를 그대로 활용할 수 있도록 OpenAI-compatible API 형..
-
하네스 엔지니어링(Harness Engineering) 완벽 가이드 | 2026 AI 에이전트 개발의 핵심AI 2026. 4. 5. 21:53
하네스 엔지니어링(Harness Engineering) 완벽 가이드프롬프트를 넘어 AI 에이전트의 '환경 전체'를 설계하는 2026년의 핵심 패러다임.정의부터 핵심 구성요소, 실전 적용 예시까지 한 글로 총정리합니다.목차하네스 엔지니어링이란?왜 지금 주목받는가?프롬프트 → 컨텍스트 → 하네스: 3단계 진화핵심 구성요소 3가지실전 적용 예시: 프로젝트 폴더 구조실제 활용 사례지금 바로 시작하기자주 묻는 질문(FAQ)1. 하네스 엔지니어링이란?"하네스(Harness)"는 원래 말(馬)에 장착하는 마구를 뜻합니다. 말의 힘을 안전하게 제어하고, 원하는 방향으로 이끌기 위한 도구죠. AI 분야에서도 같은 맥락으로 사용됩니다.하네스 엔지니어링(Harness Engineering)이란, AI 에이전트가 복잡하거나 ..
-
ADK Agent Skills 패턴 가이드: 프로그레시브 디스클로저로 AI 에이전트 확장하기AI 2026. 4. 4. 12:09
여러분의 AI 에이전트가 지시를 따르는 건 기본이에요. 그런데 스스로 새로운 지시를 작성할 수 있다면 어떨까요? Google의 Agent Development Kit(ADK)이 제공하는 SkillToolset은 에이전트가 도메인 전문성을 필요할 때만 로드하고, 나아가 런타임에 완전히 새로운 전문성을 생성할 수 있게 해줘요. 보안 리뷰 체크리스트, 컴플라이언스 감사, 데이터 파이프라인 검증 등 어떤 작업이든 "생성 → 로드 → 사용"이라는 단순한 워크플로로 처리할 수 있어요. 이 글에서는 ADK Agent Skills의 핵심 아키텍처인 프로그레시브 디스클로저(Progressive Disclosure)와, 이를 활용한 4가지 실전 패턴을 깊이 있게 다뤄볼게요.모놀리식 프롬프트의 한계와 프로그레시브 디스클로저..
-
Gemma 4로 구현하는 온디바이스 에이전트 AI 완전 가이드AI 2026. 4. 3. 22:51
Gemma 4, 엣지 AI의 새 기준을 세우다Gemma 4가 Apache 2.0 라이선스로 공개되면서 온디바이스 인공지능(AI) 개발의 지형이 크게 바뀌었어요. 단순한 챗봇 수준을 넘어 멀티스텝 플래닝(multi-step planning), 자율 행동(autonomous action), 오프라인 코드 생성, 오디오·비주얼 처리까지 별도 파인튜닝 없이 지원해요. 140개 이상의 언어를 지원하며, 구글 AI 엣지(Google AI Edge) 생태계와 긴밀히 연동돼 모바일부터 IoT 디바이스까지 즉시 배포할 수 있어요. 이 글에서는 Gemma 4의 핵심 에이전트 기능, LiteRT-LM 런타임의 성능 특성, 그리고 플랫폼별 배포 전략을 코드 수준까지 살펴볼게요.Gemma 4 에이전트 스킬(Agent Skill..