| 모델명 | granite-4.0-h-tiny |
| 개발 주체 | IBM Granite |
| 모델 규모 | 7B |
| 라이선스 | Apache-2.0 |
| 모델 유형 | Instruct |
베이스 모델 카드에 따르면 Granite-4.0-H-Tiny-Base는 약 23조(23T) 토큰으로 4단계(Four-Stage) 학습 전략을 통해 처음부터(from scratch) 학습되었습니다.
| 단계 | 토큰량 | 특징 |
|---|---|---|
| I | 15T | 일반 혼합, 웜업, Power Scheduler 학습률 |
| II | 5T | 코드·수학 비중을 늘린 일반 혼합 |
| III | 2T | 고품질 데이터, 지수형 LR 감쇠 |
| IV | 0.5T | 고품질 데이터, 0까지 선형 LR 감쇠 |
| 카테고리 | 예시 | 공개 여부 | 도메인 관련성 |
|---|---|---|---|
| 웹 | GneissWeb, Webhose | 혼합 | 일반 지식, 언어 커버리지 |
| 코드 | Code Pile, Granite Feedback, opc-annealing-corpus | 혼합 | 소프트웨어, IT, 엔터프라이즈/코드 |
| 법률·특허·금융 | Free Law, USPTO, EDGAR, SEC Filings, FDIC, 어닝 콜 | 대부분 공개 | 법률, 금융, 규제, 기업 |
| 사이버보안 | 사이버보안 웹 컴펜디움 | 공시 기준 공개 | 보안/IT 운영 |
| 엔터프라이즈·기술 | IBM Documentation, ibm.com, Top US Companies | 혼합 웹 크롤링 | 기업 문서, 회사 데이터 |
| 학술 | TxT360 Papers, 금융 연구 논문, Papers With Code | 혼합 | 과학·기술 추론 |
| 기술·웹 지식 | Wikipedia-TxT360, 금융 교과서, PG-19, LoC 퍼블릭 도메인 도서, StackExchange | 혼합 | 지식, 장문, QA |
| 수학·추론·코드 | OpenMathReasoning, OpenCodeReasoning, 합성 수학/코드 코퍼스 | 혼합 | 추론, 코드 생성 |
| 다국어 | 다수의 다국어 코퍼스, 합성 번역 | 혼합 | 다국어 능력 (사전학습 공시에 한국어 일부 언급) |
인스트럭트 모델은 Granite-4.0-H-Tiny-Base로부터 파인튜닝되었습니다.
| 방법 | 근거 | 적용 여부 |
|---|---|---|
| Instruction Tuning | 모델 카드에서 인스트럭션 데이터셋 기반 파인튜닝 명시 | 적용 |
| SFT (Supervised Fine-Tuning) | 모델 카드 및 GitHub README에서 SFT 언급 | 적용 |
| 강화학습 기반 정렬 | 모델 카드/GitHub에 강화학습 기반 모델 정렬 언급 | 적용 |
| Model Merging | 모델 카드/GitHub에서 모델 머징 언급 | 적용 |
| RLVR | 공시에 SQL 검증 가능 보상 데이터 등 RLVR 스타일 데이터셋 언급 | 특정 데이터/유스케이스에 부분 적용 |
| Architecture | granitemoehybrid MoE |
| Context Length | 131,072 tokens |
| Hidden Size | hidden_size = 1536 |
| Layers | num_hidden_layers = 40 |
| Attention Heads | GQA 형식 (Q:12, KV:4) |
| Tokenizer | BPE |
| 파일명 | 크기 (bytes) | 역할 |
|---|---|---|
| config.json | 1,796 | 아키텍처 및 생성 모델 구성 |
| chat_template.jinja | 6,418 | 시스템/유저/어시스턴트, 도구 호출, 문서/RAG용 채팅 포맷 |
| tokenizer.json | 7,153,421 | 전체 토크나이저 정의 |
| tokenizer_config.json | 17,659 | 토크나이저 동작, 특수 토큰, 최대 길이, 패딩 방향 |
| vocab.json | 2,014,114 | 토큰 어휘 |
| merges.txt | 916,646 | BPE 병합 규칙 |
| special_tokens_map.json | 579 | BOS/EOS/PAD/FIM/채팅 특수 토큰 |
| model-00001-of-00003.safetensors | 4,924,822,608 | 가중치 샤드 1 |
| model-00002-of-00003.safetensors | 4,879,018,632 | 가중치 샤드 2 |
| model-00003-of-00003.safetensors | 4,074,301,016 | 가중치 샤드 3 |
| model.safetensors.index.json | 48,924 | 텐서 이름 → 샤드 파일 매핑 |
| model.sig | 10,740 | 서명/아티팩트 검증 메타데이터 |
공공업무에서는 Apache-2.0 라이선스, 작은 활성 파라미터, 장문 컨텍스트, 도구/RAG 지원, IBM 공시 메타데이터의 조합 덕분에 SLM 모델의 서브에이전트로 활용하기 적합하다고 판단됩니다. 그러나 학습 데이터를 완전히 오픈하지 않았고 한국어 네이티브 모델이 아니기 때문에, 실 사용 시 엔터프라이즈급 다국어 모델로서 사용해야 할 것입니다.
SLM 모델로서 업무에 적용한다면 공공·행정의 법령·규정 등의 한국어 RAG QA, 컨텍스트 요약, 민원 양식 등 문서로부터의 JSON 추출 등을 먼저 시도하여 기관망에서 사용하기 적합한 모델인지 먼저 파악하고 적용하는 작업이 선행되어야 합니다.
GitHub Repository 주소: https://github.com/SJJ-universe/slm-model-report-KYWA-SungJu
파일명 예시: 행안부_김민수_slm_report.html
최종 제출 시 EDIT 버튼을 눌러 모든 항목을 채운 뒤, [HTML 저장] 버튼으로 파일을 다운로드해 GitHub Repository에 업로드하세요. 또는 EDIT하지 않고 동일한 양식 그대로 생성형 AI(Claude·ChatGPT 등)에 첨부해 채움을 요청해도 무방합니다.