https://modulabs.co.kr/community/momos/284/feeds/1661
구글에서 공개한 AI에이전트 백서 | 모두모임 | 모두의연구소
구글에서 공개한 AI에이전트 백서를 첨부합니다. 읽어보시고, AI에이전트에 대한 생각을 공유해 보세요 개요본 브리핑 문서는 Google에서 발표한 에이전트에 관한 백서의 주요 내용을 요약하고,
modulabs.co.kr
https://modulabs.co.kr/community/momos/284/feeds
AI 에이전트 LAB | 모두모임 | 모두의연구소
AI 에이전트 기술 연구 및 개발과 활용
modulabs.co.kr
에이전트란 무엇인가?
에이전트는 자율적이고 독립적으로 행동하며 여러 단계를 거치면서 스스로 생각하고 결정하며 결과물을 도출한다.
일반적인 LLM과 비교해서 학습 데이터에 제한되지 않고 도구를 통해 외부 시스템과 연결하여 지식을 확장하며 추론한다. LLM은 쿼리 기반 단일 추론일 때 에이전트는 다중 턴 추론과 예층이 가능하다. 또한 메모리를 통해 세션 기록을 유지하여 대화를 이어서 할 수 있고 CoT, ReAct 등 네이티브 인지 아키텍처를 사용한다.
에이전트의 인지 아키텍처 작동 방식
오케스트레이션 레이어 : 에이전트가 정보를 받아들이고, 내부 추론을 수행하고, 그 추론을 사용하여 다음 작업이나 결정을 내리는 방법을 관리하는 주기적인 프로세스이다. 목표 달성을 하거나 중단 시점까지 루프를 지속한다.
오케스트레이션 레이어는 ReAct (reasoning + acting), ReAct 시퀀스, Chain of Thought, Tree of Thought 와 같은 프레임워크를 사용하여 에이전트의 생각을 안내한다.
- ReAct (Reasoning + Acting): 추론과 행동을 반복적으로 수행하는 프레임워크입니다. 단계별 생각 단계를 거친 후 이를 기반으로 행동(외부 도구 호출 등)을 실행합니다. 외부 도구를 많이 사용할 때 유용합니다. "ReAct는 문맥에 맞는 예제를 포함하거나 포함하지 않고도 사용자 쿼리를 추론할 수 있습니다."
- ReAct 시퀀스: 질문(사용자 쿼리) -> 생각(다음에 할 일에 대한 모델의 생각) -> 액션(취할 행동 결정, 도구 선택 가능) -> 작업 입력(도구에 제공할 입력) -> 관찰(액션 결과) -> 최종 답변. 이 생각/행동/행동 입력/관찰은 필요에 따라 반복됩니다.
- Chain-of-Thought (CoT): 복잡한 논리 및 수학 문제 등을 풀 때 단계별 생각을 이어붙이면서 말로 표현하듯이 답변을 내놓는 프롬프트 기법입니다. 답변 과정이 명확해야 하는 상황에 적합합니다. "중간 단계를 통해 추론 기능을 구현하는 신속한 엔지니어링 프레임워크입니다."
- Tree-of-Thought (ToT): 문제를 해결하는 과정에서 나무 구조로 브랜치를 만들어 여러 경우의 수를 고려하며 답변하는 기법입니다. 한 가지 답만 있는 상황이 아니라 여러 해결책이나 전략을 고려해야 하는 작업(예: 게임 전략 설계)에 사용됩니다. "탐색 또는 전략적 탐색 작업에 적합한 프롬프트 엔지니어링 프레임워크입니다."
에이전트의 도구 활용
에이전트는 외부 데이터에 접근하여 실제 정보를 처리하고 더 광범위한 작업을 수행할 수 있다. 확장 기능, 함수, 데이터 저장소를 활용한다.
- 확장 기능 (Extensions): 표준화된 방식으로 API와 에이전트 간의 격차를 해소하여 에이전트가 API를 원활하게 실행할 수 있도록 합니다. 에이전트에게 예시를 통해 API 엔드포인트 사용 방법과 성공적인 호출에 필요한 인수/매개변수를 가르칩니다. 에이전트가 직접 API 호출을 실행합니다. 개발자는 여러 개의 확장을 만들어 에이전트가 사용자의 쿼리에 가장 적합한 확장을 동적으로 선택하도록 할 수 있습니다.
- 함수 (Functions): 개발자가 데이터 흐름과 시스템 실행을 더 세밀하게 제어할 수 있도록 하는 프레임워크입니다. 모델은 함수와 그 인수를 출력하지만, 실제 라이브 API 호출을 수행하지는 않습니다. 함수는 에이전트 측이 아닌 클라이언트 측에서 실행됩니다. 개발자는 함수 호출을 통해 데이터 변환 로직을 적용하거나, API 호출을 에이전트 아키텍처 외부에서 수행하거나, 보안/인증 제한이 있는 API를 호출하거나, 타이밍/작업 순서 제약 조건이 있는 상황을 처리할 수 있습니다. 모델은 클라이언트 측에서 실행될 함수에 필요한 매개변수를 생성하는 데 활용됩니다.
- 데이터 저장소 (Data Stores): 모델의 학습 데이터 이외의 최신 정보에 접근할 수 있도록 합니다. 스프레드시트, PDF, 웹사이트 콘텐츠 등 다양한 형태의 정형 또는 비정형 데이터를 저장하고 관리하여 에이전트가 필요할 때 정보를 추출할 수 있도록 합니다. 일반적으로 벡터 데이터베이스로 구현되며, 검색 증강 생성(RAG) 기반 애플리케이션에 활용됩니다.
모델 성능 향상을 위한 목표 학습
- 상황에 맞는 학습 (In-context Learning): 추론 시점에 프롬프트, 도구, 예시를 제공하여 모델이 도구 사용 방법을 즉시 학습하도록 합니다. ReAct 프레임워크가 이 접근 방식의 예입니다.
- 검색 기반 컨텍스트 내 학습 (Retrieval-based In-context Learning): 외부 메모리(데이터 저장소 등)에서 가장 관련성이 높은 정보, 도구, 예시를 검색하여 모델 프롬프트를 동적으로 채웁니다. 데이터 저장소 RAG 아키텍처가 이에 해당합니다.
- 미세 조정 기반 학습 (Fine-tuning based Learning): 추론 전에 특정 예시의 대규모 데이터 세트로 모델을 학습시킵니다. 모델이 사용자 쿼리 전에 특정 도구 적용 방법을 이해하도록 합니다. 특정 지식 영역에서 모델 성능을 높일 때 유용합니다.
이러한 접근 방식은 속도, 비용, 지연 시간 측면에서 장단점을 가지며, 에이전트 프레임워크에 결합하여 사용하면 더 강력하고 적응력 있는 솔루션을 제공할 수 있습니다.
'주간 랩업 > [HMA] 심화_생성형 AI활용 인재양성 부트캠프' 카테고리의 다른 글
| [스터디] Learn In Context (3) | 2025.06.05 |
|---|---|
| [AI 스터디] 딥 리서치 AI 모델 (0) | 2025.05.28 |