Tan Kim

gemini

Gemini

Google DeepMind가 개발한 멀티모달 AI 모델. 텍스트, 이미지, 오디오, 비디오, 코드를 처리.

모델 라인업

모델 특징 용도
Gemini Ultra 최고 성능 복잡한 추론, 연구
Gemini Pro 범용, 균형 API, 일반 태스크
Gemini Flash 경량, 빠름 실시간, 대용량 처리
Gemini Nano 온디바이스 모바일, 오프라인

버전 히스토리

버전 출시 주요 특징
Gemini 1.0 2023.12 최초 공개, 멀티모달
Gemini 1.5 Pro 2024.02 1M 컨텍스트 윈도우
Gemini 1.5 Flash 2024.05 경량 고속 버전
Gemini 2.0 Flash 2025.01 멀티모달 출력 지원
Gemini 2.5 Pro 2025.03 강화된 추론 능력

주요 특징

  • 1M 컨텍스트: Gemini 1.5부터 최대 100만 토큰 (약 700,000 단어)
  • 멀티모달: 텍스트 + 이미지 + 오디오 + 비디오 + 코드
  • Code Execution: 코드를 실제로 실행해 결과 반환
  • Google 생태계 통합: Google Docs, Gmail, Search 등
  • Grounding: Google Search 연동으로 최신 정보 검색

API 사용 (Google AI SDK)

import google.generativeai as genai
 
genai.configure(api_key="YOUR_API_KEY")
 
model = genai.GenerativeModel("gemini-2.0-flash")
 
response = model.generate_content("Python으로 피보나치 수열 구현해줘")
print(response.text)

멀티모달 (이미지 + 텍스트)

import PIL.Image
 
model = genai.GenerativeModel("gemini-2.0-flash")
 
image = PIL.Image.open("chart.png")
response = model.generate_content([image, "이 차트 분석해줘"])
print(response.text)

스트리밍

response = model.generate_content(
    "긴 글 작성해줘",
    stream=True
)
 
for chunk in response:
    print(chunk.text, end="", flush=True)

채팅 (멀티턴)

chat = model.start_chat(history=[])
 
response = chat.send_message("안녕!")
print(response.text)
 
response = chat.send_message("방금 한 말 기억해?")
print(response.text)

Vertex AI (GCP)

import vertexai
from vertexai.generative_models import GenerativeModel
 
vertexai.init(project="my-project", location="us-central1")
 
model = GenerativeModel("gemini-2.0-flash-001")
response = model.generate_content("Hello!")
print(response.text)

Gemini vs Claude vs GPT-4o

항목 Gemini 2.0 Flash Claude Sonnet GPT-4o
컨텍스트 1M 200K 128K
멀티모달 텍스트/이미지/오디오/비디오 텍스트/이미지 텍스트/이미지/오디오
속도 빠름 중간 중간
Google 연동 강함 없음 없음

메모