Moderne AI-arkitektur

Bygget for norsk språk, europeisk data-suverenitet og enterprise-sikkerhet.

Spesifikasjoner

Kraftig norsk språkmodell bygget på moderne AI-teknologi

Base modell
Qwen 2.5 14B Instruct
Treningsdata
500M tokens norsk tekst
Kontekst
8192 tokens (~6000 ord)
Hastighet
0.37-0.71s til første token
GPU
NVIDIA RTX 4000 Ada (20GB VRAM)
Hosting
Hetzner Cloud (Nürnberg, Tyskland - EØS)
API Format
OpenAI-kompatibelt REST API
Sikkerhet
Keycloak SSO + JWT autentisering

Rask inferens

AWQ-kvantisering for optimal ytelse uten kvalitetstap.

🔒

GDPR-sikker

All data lagres i EØS med full GDPR-compliance.

🇳🇴

Norsk-optimalisert

Fine-tunet på 500M tokens norsk tekst for optimal forståelse.

🔄

OpenAI-kompatibel

Drop-in replacement for OpenAI API - enkel integrasjon.

Ytelse i tall

99.9% Uptime

SLA-garantert tilgjengelighet

< 100ms Latency

Gjennomsnittlig responstid

8192 Tokens

Maksimal kontekst-vindu

24/7 Support

Norsk teknisk support