Od1n Master
Hovedmodellen for videre spesialisering – designet for krevende bruksområder med høy språklig presisjon.
- 1,5 milliarder parametere
- Treningsmål: Opptil 48 milliarder tokens
- Rolle: Hovedmodell for videre spesialisering
- Arkitektur: Transformer med GQA, RoPE, SwiGLU, FlashAttention
