Gemini 업데이트 정리: 3.5 Flash 액션 에이전트가 전작과 얼마나 달라졌나
· Gemini · Gemini 3.5 Flash · AI 에이전트
목차
- 도입 권장: Gemini 3.5 Flash는 MCP Atlas 83.6%, Terminal-Bench 76.2%로 전작 대비 액션 에이전트 성능이 크게 향상되어 실서비스 자동화 워크플로우 도입에 적합합니다.
- 4배 빠른 출력 처리 속도와 1M 토큰 컨텍스트 창을 지원하며, 함수 호출·코드 실행·검색 도구를 단일 모델에서 통합 제공합니다.
- 현재 Gemini API, Google AI Studio, Android Studio 등 5개 채널에서 일반 공개 상태이며, 개인용 AI 에이전트 Gemini Spark는 미국 AI Ultra 구독자 대상 베타 중입니다.
Gemini 3.5 Flash가 2025년 공개되면서 AI 에이전트 성능 기준이 다시 바뀌었습니다. 단순 질답 모델이 아니라 터미널 명령 실행, 멀티스텝 워크플로우, 외부 도구 연동까지 자율 처리하는 '액션 에이전트' 역할로 진화한 것입니다.
이 글은 Gemini 3.5 Flash가 기존 Gemini 3 Flash 대비 무엇이 달라졌는지, 구체적인 벤치마크 수치와 출시 채널 정보를 중심으로 정리합니다.
핵심 액션 에이전트 기능 — 통합 도구와 Gemini Spark
이번 모델의 가장 큰 변화는 '액션 에이전트' 역할입니다. 한마디로, 사람이 명령 한 줄을 내리면 모델이 스스로 여러 단계를 계획하고 실행하는 자율 비서처럼 동작합니다.
구체적으로는 함수 호출(Function Calling), 코드 실행(Code Execution), 검색 도구(Search Grounding), MCP Atlas 멀티스텝 워크플로우라는 네 가지 도구를 단일 모델 안에서 통합 제공합니다. 기존에는 각각 별도 설정이나 외부 플러그인이 필요했던 부분이 하나로 묶인 셈입니다.
개인용 AI 에이전트인 Gemini Spark는 이 모델을 기반으로 구동됩니다. 신뢰할 수 있는 테스터(Trusted Tester) 그룹에 먼저 롤아웃 중이며, 미국 내 Google AI Ultra 구독자에게는 베타 버전이 공개 예정입니다.
- 함수 호출(Function Calling): 외부 API나 개발자가 정의한 함수를 모델이 직접 호출해 결과를 본문에 반영합니다.
- 코드 실행(Code Execution): Python 등 코드를 샌드박스 내에서 실행하고 출력값을 다음 단계에 연결합니다.
- 검색 도구(Search Grounding): Google Search를 활용해 최신 정보를 조회하고 응답에 반영합니다.
- MCP Atlas 멀티스텝: 여러 도구 호출을 연결한 복합 워크플로우를 자율적으로 계획·실행합니다.
- Gemini Spark: 3.5 Flash 기반 개인용 AI 에이전트로, 사용자의 일상 작업을 자동화하는 형태로 진화 중입니다.
전작 Gemini 3 Flash와 벤치마크 수치 비교
벤치마크 수치를 보면 변화가 얼마나 컸는지 분명하게 드러납니다. Terminal-Bench 2.1 기준으로 Gemini 3 Flash는 58.0%였지만, 3.5 Flash는 76.2%까지 올랐습니다. 약 31% 상승한 수치입니다.
멀티스텝 워크플로우를 평가하는 MCP Atlas에서는 더 큰 도약이 확인됩니다. Gemini 3 Flash의 62.0%에서 3.5 Flash는 83.6%를 기록했습니다. 21.6%p 증가로, 복합 에이전트 시나리오에서 신뢰성이 크게 높아진 것입니다.
종합 지능 평가 벤치마크인 GDPval-AA에서는 1656 Elo 점수를 기록했습니다. 처리 속도 면에서도 다른 프론티어 모델 대비 초당 출력 토큰이 4배 빠르다고 명시되어 있습니다.
지금 바로 쓰는 방법 — 5개 출시 채널 안내
Gemini 3.5 Flash는 출시 당시 총 5개 채널을 통해 공개되었습니다. 개발자·기업·개인 사용자 각각 접근 경로가 다르므로 본인 상황에 맞는 채널을 선택하면 됩니다.
텍스트, 이미지, 비디오, 오디오, PDF 입력을 모두 지원하며 최대 100만(1M) 입력 토큰과 64k 출력 토큰을 처리할 수 있습니다. 훈련 데이터 기준은 2025년 1월입니다.
함수 호출과 구조화된 출력(Structured Output)은 API 레벨에서 바로 활용 가능하며, 개발자는 Google AI Studio를 통해 프롬프트 프로토타이핑 후 Gemini API로 연동하는 흐름이 일반적입니다.
- Google Antigravity: 초기 접근 프로그램으로, 파트너사 및 선별 개발자를 대상으로 먼저 제공됩니다.
- Gemini API: REST·gRPC API를 통해 함수 호출, 코드 실행, 구조화 출력 등 전체 기능을 프로그래밍 방식으로 활용 가능합니다.
- Google AI Studio: 브라우저 기반 프롬프트 테스트 환경. API 키 발급부터 멀티모달 입력 테스트까지 무료로 지원합니다.
- Android Studio: Android 앱 개발에 3.5 Flash 기능을 직접 통합할 수 있는 IDE 플러그인 형태로 제공됩니다.
- Gemini Enterprise Agent Platform: 기업 워크플로우 자동화 플랫폼으로, 업무용 에이전트 배포에 최적화된 관리 기능을 제공합니다.
자주 묻는 질문
Q. Gemini 3.5 Flash는 무료로 사용할 수 있나요?
Google AI Studio를 통해 제한된 무료 사용이 가능합니다. Gemini API는 사용량 기반 유료 과금 구조이며, 기업용 Gemini Enterprise Agent Platform은 별도 계약이 필요합니다. 정확한 요금은 Google Cloud 공식 가격 페이지를 확인하세요.
Q. Gemini Spark는 언제 한국에서 출시되나요?
공식 발표 기준으로 Gemini Spark는 신뢰할 수 있는 테스터 그룹에 먼저 롤아웃 중이며, 미국 내 Google AI Ultra 구독자에게 베타 제공 예정입니다. 한국 출시 시점은 별도로 공개되지 않았으므로 Google 공식 채널을 모니터링하는 것이 좋습니다.
Q. 1M 토큰 컨텍스트는 실제로 사용 가능한가요?
공식 사양에 따르면 최대 100만 입력 토큰과 64k 출력 토큰을 지원합니다. 단, 컨텍스트 길이가 길어질수록 레이턴시가 증가하고 비용도 높아지므로, 실사용에서는 필요한 범위만 입력하는 것이 효율적입니다.
Q. 기존 Gemini 3 Flash API와 호환되나요?
Gemini API는 모델 ID를 파라미터로 지정하는 구조이므로, 코드에서 모델 ID만 3.5 Flash 버전으로 변경하면 대부분의 경우 기존 통합을 그대로 활용할 수 있습니다. 다만 함수 호출 스키마나 응답 포맷이 일부 변경될 수 있으니 릴리즈 노트 확인을 권장합니다.
Q. 다른 프론티어 모델 대비 속도가 4배 빠르다는 근거는?
Google DeepMind의 공식 모델 페이지(deepmind.google/models/gemini/flash/)에 '초당 출력 토큰 기준 다른 프론티어 모델 대비 4배 빠름'으로 명시되어 있습니다. 비교 대상 모델과 측정 환경은 해당 페이지에서 확인할 수 있습니다.