Kernbotschaft

Ollama lädt Sprachmodelle auf den eigenen Rechner herunter und stellt sie lokal bereit — für eigene Anwendungen und andere Programme. Patientendaten, Rezeptinfos und interne Dokumente bleiben dabei auf der eigenen Hardware.

Was Ollama leistet

Modelle herunterladen

Ein einziger Befehl im Terminal genügt — Ollama lädt das gewählte Sprachmodell herunter und richtet es ein. Kein Konto, kein API-Key nötig.

Modelle bereitstellen

Ollama stellt eine lokale API zur Verfügung — andere Programme auf demselben Rechner oder im Netzwerk können das Modell wie einen Cloud-Dienst ansprechen.

Daten bleiben lokal

Keine Anfrage verlässt den Rechner. Ideal für Apothekenalltag: Patienten-Infos, interne Dokumente und Rezepte lassen sich ohne Datenschutzrisiko verarbeiten.

Drei Gründe für den Einstieg

Kostenlos

Ollama ist Open Source und kostenlos. Die meisten Modelle (Llama, Mistral, Gemma, Phi) sind ebenfalls frei verfügbar — kein Abo, keine Nutzungsgebühr pro Anfrage.

Einfacher Einstieg

Installation über die offizielle Website, ein Terminal-Befehl zum Starten — fertig. Kein Serveraufbau, keine Konfigurationsdatei, keine Programmierkenntnisse nötig.

Läuft offline

Nach dem Download funktioniert das Modell ohne Internetverbindung — kein Ausfall durch Cloud-Störungen, keine Latenz durch externe Server.

Wie Ollama das Modell bereitstellt

Ollama als lokaler Modell-Server

Anwendungen
Claude Cowork
n8n · Open WebUI
Ollama
Lokale API
:11434
Sprachmodell
Llama · Mistral
Gemma · Phi
Cloud (optional)
Claude · GPT
über API

Ollama übernimmt die Rolle eines lokalen API-Servers: Programme wie Claude Cowork, n8n oder Open WebUI schicken ihre Anfragen an Ollama — genau wie sie es bei Cloud-Modellen tun. Ollama kann zusätzlich als Brücke zu Cloud-Modellen dienen, wenn für bestimmte Aufgaben mehr Rechenleistung gebraucht wird.

Mindestvoraussetzungen

Hardware-Anforderungen im Überblick

Komponente Minimum Empfohlen Hinweis
Betriebssystem macOS 11, Windows 10, Linux macOS 13+, Windows 11 Ollama läuft auf allen gängigen Systemen
RAM 8 GB 16 GB oder mehr Mit 8 GB: kleine Modelle (1–4 B). Mit 16 GB: mittlere Modelle (7–8 B) flüssig nutzbar
Speicherplatz 5 GB frei 20–50 GB frei Je nach Modellgröße: Llama 3.2 (3 B) ≈ 2 GB, Llama 3.1 (8 B) ≈ 5 GB
Prozessor Moderner CPU (Intel/AMD/Apple Silicon) Apple Silicon (M1–M4) oder dedizierte GPU Apple M-Chips: beste Effizienz für lokale KI
GPU (optional) Nicht zwingend nötig NVIDIA RTX 3060+ oder Apple M-Chip GPU beschleunigt die Antwortgeschwindigkeit deutlich
Internetverbindung Nur für Download nötig Nach dem Download: vollständig offline nutzbar

Praxistipp: Ein aktueller Laptop mit Apple Silicon (MacBook Air M2/M3) oder ein Windows-Rechner mit 16 GB RAM genügen für die meisten Alltagsaufgaben in der Apotheke — Texte zusammenfassen, Dokumente analysieren, Fragen beantworten.

Installation in drei Schritten

Ollama einrichten

1
Ollama herunterladen ollama.com aufrufen → passende Version für macOS, Windows oder Linux herunterladen → Installer ausführen. Fertig — Ollama läuft jetzt im Hintergrund.
2
Modell herunterladen Terminal öffnen und ollama pull llama3.2 eingeben. Ollama lädt das Modell herunter und richtet es ein — dauert je nach Verbindung einige Minuten.
3
Modell testen ollama run llama3.2 im Terminal — der Chatbot antwortet sofort, vollständig lokal, ohne Internetverbindung.
Code-Beispiel — Codex App mit Ollama starten

Terminal-Befehle

# Codex App starten — Ollama lädt das Modell und öffnet die Oberfläche ollama launch codex-app # Codex App beenden — Modell wird entladen, Speicher freigegeben ollama launch codex-app --restore

Was die Befehle bewirken

ollama launch codex-app
Startet die Codex App — Ollama lädt das zugehörige Sprachmodell in den Arbeitsspeicher und öffnet die Anwendungsoberfläche. Alle Anfragen werden lokal verarbeitet.
ollama launch codex-app --restore
Beendet die Codex App geordnet — das Modell wird aus dem Arbeitsspeicher entladen, der Speicher wieder freigegeben. Der Sitzungsstand wird dabei gesichert (Restore-Modus).

Datenschutz-Vorteil: Alle Anfragen an das lokale Modell bleiben auf dem eigenen Rechner — kein Drittanbieter sieht die Daten. Patientennamen, Rezeptinhalte und Beratungsnotizen lassen sich bedenkenlos einsetzen. Lokale KI ist damit eine datenschutzkonforme Grundlage für den Einsatz sensibler Daten in der Apotheke.