최대 1 분 소요

개요

  • AI 모델을 개발·실험·배포하기 위한 플랫폼 및 도구
  • Hugging Face(클라우드 모델 허브), Colab(클라우드 GPU 노트북), Ollama(로컬 LLM 실행) 등이 대표적
  • 로컬 LLM 실행 도구 Ollama는 별도 포스트 참고: Ollama


Hugging Face

  • 공식 사이트
  • AI 분야의 “GitHub”로 불리는 모델·데이터셋 허브
  • 주요 기능
    • Model Hub: 100만+ 사전학습 모델 공유 (GPT, Llama, BERT, Stable Diffusion 등)
    • Datasets: 벤치마크 및 학습 데이터셋 저장소
    • Spaces: AI 데모 앱 호스팅 (Gradio, Streamlit)
    • Transformers 라이브러리: 모델 로드·파인튜닝 통합 API
    • Inference API / Inference Endpoints: 모델 API 호출 및 배포
  • Python 사용 예시

    from transformers import AutoModelForCausalLM, AutoTokenizer
    model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3.2-1B")
    


Ollama (로컬 LLM)

  • 로컬에서 LLM을 실행하는 도구. CLI 한 줄로 모델 다운로드·실행·서빙
  • OpenAI 호환 API 제공으로 기존 도구와 쉽게 통합
  • 자세한 내용은 별도 포스트 참고: Ollama


Google Colab

  • 공식 사이트
  • 브라우저 기반 Jupyter Notebook 환경
  • 무료 GPU/TPU 제공 (사용 제한 있음)
  • Colab Pro / Pro+: 더 많은 컴퓨팅 자원, 백그라운드 실행
  • Google Drive 연동으로 파일 저장


기타 주요 도구

도구 목적
Weights & Biases (W&B) 실험 추적, 모델 레지스트리
MLflow 실험 관리, 모델 서빙
Gradio AI 데모 UI 빠른 개발
vLLM 고성능 LLM 서빙 (PagedAttention)
llama.cpp CPU에서 LLM 실행 (GGUF 포맷)
LM Studio GUI 기반 로컬 LLM 실행


관련 포스트