Träna lokalt expert-system
publicerat av Midsommarkransen Devops Ab
Om exjobbet:
- Företag
- Midsommarkransen Devops Ab
- Plats
- Stockholm
- Beskrivning
-
## Bakgrund
Vi arbetar med AI-lösningar som är skräddarsydda för att ge djupare insikter i svenska trender och diskussioner. Under de senaste åtta åren har vi samlat över 3000 timmar av svenska TV-program, vilka har auto-transkriberats med hjälp av whisper-ctranslate2. Datasetet är välstrukturerat och inkluderar titlar, datum, beskrivningstexter och kontextuella taggar, vilket ger en solid bas för att träna en avancerad AI-modell. Videomaterialet, cirka 6 TB, finns tillgängligt lokalt i vår objektlagring (S3) i Stockholm. Målet med examensarbetet är att utveckla en AI-modell som kan tillämpas inhouse och användas som en lokalanpassad variant av ChatGPT 4, med fokus på svenska trender och samhällsdiskussioner.
## Mål
Att utveckla och implementera en AI-modell enligt följande målbild:
1. Förstå och analysera det transkriberade innehållet för att generera relevanta svar i lokal svensk kontext.
2. Optimera modellens prestanda för drift och underhåll i vår containerplattform
3. Tillgängliggöra modellen för andra applikationer/integrationer för att fungera som expert-system/beslutsstödsystem.
4. Fungera som en prototyp för framtida AI-lösningar baserade på lokala data.
## Beskrivning av uppdraget
Examensarbetet omfattar följande huvuduppgifter:
1. **Databearbetning:** Utforska och validera det redan strukturerade datasetet, med möjlighet att använda både text- och videomaterial.
2. **Modellutveckling:**
a) Träna en språkmodell baserat på transformer-arkitekturer (exempelvis GPT).
b) Integrera lokal kontext och metadata (titlar, taggar, beskrivningar) för att förbättra modellens relevans.
3. **Benchmarking:**
a) Jämföra prestandan mot etablerade AI-modeller.
b) Utvärdera hur väl modellen hanterar svenska specifika frågeställningar och diskussioner.
4. **Implementation och driftsättning:**
a) Anpassa modellen för att köras i vår objektlagring (S3) och datahallar i Stockholm.
b) Säkerställa att lösningen är effektiv, skalbar och reproducerbar för inhouse-miljöer.
5. **Rapportering och presentation:**
a) Dokumentera projektets resultat i en skriftlig rapport.
b) Presentera arbetet för företagets utvecklingsteam och samarbetspartners.
## Utbildning och önskvärda kompetenser
Vi söker studenter från civilingenjörsprogram med fokus på systemutveckling, AI eller maskininlärning. Följande kompetenser är önskvärda:
1. Erfarenhet av att arbeta med stora språkmodeller och maskininlärning (exempelvis TensorFlow eller PyTorch).
2. Grundläggande kunskap om arbete med strukturerade dataset och lagring (exempelvis S3).
3. Programmeringskunskaper i Python, särskilt med bibliotek som Hugging Face Transformers.
4. Verktygslåda bestående av GitHub, macOS, Linux, och Kubernetes.
5. Utveckla och bidra till Open Source-projekt.
## Övrigt
Antal studenter: 1–2.
Startdatum: Flexibelt under vårterminen 2025.
Beräknad tidsåtgång: 20 veckor (30 hp).
## Arbetsmiljö
Projektet utförs delvis på plats i Stockholm, delvis på distans. Studenten har tillgång till handledning, infrastruktur och utvecklingsverktyg.
## Kontaktperson och handledare
Mats Blomdahl, projektledare
+46 730 567 567
mats@mkdevops.se
----
Vi ser fram emot att välkomna ambitiösa studenter som vill skapa en AI-modell med lokal förankring och verklig påverkan! - Förkunskapskrav
-
- Sista ansökningsdag
- Dec. 18, 2024
- Ansök här
- Ansök via e-mail
© 2024 Exjobb.com | Personuppgifter | Privacy Policy | Villkor