본문 바로가기

LLM2

Gemini 업데이트 정리: 3.5 Flash 액션 에이전트가 전작과 얼마나 달라졌나 2026년 05월 23일· Gemini · Gemini 3.5 Flash · AI 에이전트목차핵심 액션 에이전트 기능 — 통합 도구와 Gemini Spark전작 Gemini 3 Flash와 벤치마크 수치 비교지금 바로 쓰는 방법 — 5개 출시 채널 안내자주 묻는 질문한 줄 요약도입 권장: Gemini 3.5 Flash는 MCP Atlas 83.6%, Terminal-Bench 76.2%로 전작 대비 액션 에이전트 성능이 크게 향상되어 실서비스 자동화 워크플로우 도입에 적합합니다.4배 빠른 출력 처리 속도와 1M 토큰 컨텍스트 창을 지원하며, 함수 호출·코드 실행·검색 도구를 단일 모델에서 통합 제공합니다.현재 Gemini API, Google AI Studio, Android Studio 등 5개 채널에.. 2026. 5. 24.

구글 TPU 8i, 달러당 성능 80% 향상 — LLM 추론 비용 전략 어떻게 바뀌나 구글 TPU 8i, 달러당 성능 80% 향상 — LLM 추론 비용 전략 어떻게 바뀌나2026년 05월 04일· TPU 8i · TPU 8t · LLM 추론 비용 전략 목차LLM 추론 비용·인프라 선택에 실제로 영향을 주는가TPU 8t vs TPU 8i — 무엇이 어떻게 다른가핵심 수치로 보는 8세대 TPU 성능 변화구글 인프라 전략의 변화 — TPU 독점에서 다중 하드웨어로자주 묻는 질문한 줄 요약TPU 8i는 동일 비용 대비 추론 처리량 약 2배로 LLM 서빙 비용 전략에 즉각 영향을 주며, TPU 8t는 초대형 모델 학습·실행 전용으로 역할이 분리되어 인프라 선택 기준도 워크로드 유형에 따라 이원화할 것을 권장합니다.달러당 성능 80% 향상(8i 기준)이라는 수치는 동일 예산으로 약 2배의 추론 트래.. 2026. 5. 5.

이전 1 다음

티스토리툴바