ProduktMietpreisbremseSicherheitRechtsprechungCorpusDenkenLoginDemo →
Mila / Changelog Was wir bauen, während wir bauen.

Changelog.

Jede Woche, manchmal zweimal. Was wir geliefert haben, was sich verändert hat, was als Nächstes ansteht. Ohne PR-Floskeln.

Warum öffentlich
Die meisten Legal-Tech-Anbieter schreiben Roadmaps für ihre Investoren und Release-Notes für ihre Support-Teams. Wir nicht. Was wir bauen, wofür wir uns entschieden haben, und welche Wette wir gerade laufen — alles steht hier. Kanzleien, Konkurrenten, Presse: gleicher Zugriff, gleicher Tag.
5
Releases · 2026
1.178
Verifizierte Entscheidungen
v1.4.2
Aktuelle Version
v1.4.2

Zitat-Disziplin: keine AZs aus dem Gedächtnis.

Die häufigste Halluzination im Mietrechts-RAG ist nicht das erfundene Aktenzeichen — sondern das echte, an die falsche Aussage geheftet. Wave D schließt das.

UI · CITE-GATE v2
BGH Urteil vom 14.03.2024 · VIII ZR 22/23

»Die qualifizierte Rüge nach § 556g BGB erfordert eine Bezifferung der monatlichen Rückforderung.«

Topic-Match · AZ verifiziert · Behauptung gedeckt
Topic-Match-Enforcement · Jedes AZ wird nicht nur auf Existenz, sondern auf Doktrin-Übereinstimmung mit der Aussage geprüft. Binary success criterion. Regex + 9 Wave-D-Files im Scope.

Die Failure-Mode, die uns am meisten gekostet hat, war nicht die klassische Halluzination. Es war das echte Aktenzeichen — verifiziert im Corpus, sauber geschrieben, mit allem drum und dran — angeheftet an eine doktrinale Behauptung, die das Urteil so nie getroffen hat. Das Cite-Gate ging durch. Der Output sah aus wie sauberes Mietrecht. War es aber nicht.

Wir nennen das Proposition-Misattribution. Es ist gefährlicher als reine Halluzination, weil es nicht nur Vertrauen kostet — es passt auch durch jeden naiven Verifier durch. Das AZ existiert. Das Urteil ist real. Die Verknüpfung ist falsch.

Was sich geändert hat

Wave D fügt einen zweiten Gate-Layer über die existierende AZ-Verifikation. Jedes emittierte AZ muss jetzt zusätzlich einen Topic-Match-Test bestehen: gleicht das doktrinale Thema, das die Behauptung trägt, dem doktrinalen Thema, das durch das Urteil tatsächlich entschieden wurde?

Konkret: wir haben Regex-Patterns über alle cite_emit-Stellen gezogen und neun Wave-D-Files in Scope gebracht. Binary success criterion — entweder Topic-Match passt, oder das AZ wird nicht emittiert. Keine Konfidenz-Schwellen, keine fuzzy matches.

Was als Nächstes kommt

Citation-Integrity-Audit, geplant nach 24h Pipeline-Stabilität. Strukturelle Prüfung über alle bisher emittierten Drafts: existiert das AZ, sagt das Urteil tatsächlich was der Draft behauptet. Audit-Output wird hier veröffentlicht.

  • RAG Reranker-Tuning für Mietpreisbremse-Cluster. Topic-Embeddings priorisieren §§ 556d–g vor allgemeinem Mietrecht.
  • UI Befund-Approval: Sidebar-Spacing erhöht. Editorial-Section-Heads jetzt mit Hairline-Top-Rule statt 2px-Ink.
  • Spine Stage 01 analyse-document handler-coverage von 7 auf 9 doc_type-Familien.
  • Auth Bug behoben: accept-invite erlaubte unter bestimmten Race-Conditions doppelte team_members-Einträge. Datenbank-Trigger jetzt durchsetzend.
  • Email Postmark-Bounce-Logs werden bei Soft-Bounces nicht mehr als Hard-Failures markiert.
v1.4.1

Rechtsprechungs-Browser: 1.178 Entscheidungen, neun Themen, eine Tür.

Was bei Grüneberg in 800–1.200 zitierten Entscheidungen steht, steht jetzt auch bei uns — durchsuchbar, gefiltert, mit Topic-Tags.

/rechtsprechung/corpus
Rechtsprechung · Themen 1.178 Urteile
Mietpreisbremse §§ 556d–g BGB · Kappung, qualifizierte Rüge, Rückforderung
312
Mängelanzeige § 536 BGB · Minderung, Mängelrechte
187
Mieterhöhung §§ 558–559 BGB · Vergleichsmiete, Modernisierung
156
Räumungsabwehr § 543 BGB · außerordentliche Kündigung
98
697 BGH · 481 Regionalgericht. Nur Mietrecht. Nicht inflationiert, nicht hochgerechnet.

Der Grüneberg-Kommentar zitiert je nach Auflage 800 bis 1.200 mietrechtliche Entscheidungen. Das ist die Benchmark, an der wir uns gemessen haben — und an der wir uns weiter messen lassen. Mit 1.178 verifizierten Entscheidungen sind wir auf Augenhöhe.

»Verifiziert« heißt: jede Entscheidung wurde händisch geprüft, die Doktrin getaggt, die Zitate normalisiert. Keine Web-Scrapes, keine LLM-generierten Zusammenfassungen, kein Fluff aus 5.181 Nicht-Mietrechts-Urteilen in der gleichen Datenbank.

Neun Themen-Kacheln

Die Themen-Übersicht auf /rechtsprechung/corpus spiegelt jetzt die echten DB-Counts: Mietpreisbremse, Mängelanzeige, Mieterhöhung, Räumungsabwehr, Betriebskosten, Schönheitsreparaturen, Untermiete, Eigenbedarf, Kaution. Vierzehn § -Landing-Pages dazu. Einschätzungs-Tool unter /rechtsprechung/einschaetzung.

Was das für die Beratung verändert: du musst nicht mehr glauben, dass das Urteil existiert. Du siehst es. Mit Volltext, mit Doktrin-Tags, mit verlinkten Folge-Entscheidungen.

  • UI Themen-Kacheln: Hairline-Hover statt Drop-Shadow. Editorial-Register beibehalten.
  • Search Volltext-Search über alle 1.178 Urteile. Inverted Index mit Postgres FTS.
  • Tags Doktrin-Tags über 47 Sub-Themen. Mehrfach-Tagging möglich pro Urteil.
  • SEO 14 § -Landing-Pages für Long-Tail-Suchen. Strukturierte Daten ausgespielt.
v1.4.0

Editorial-Register, end-to-end.

Mila sieht jetzt wie Mila aussehen sollte. Source Serif 4 überall, Cream-Paper statt Weiß, Hairlines statt Schatten, italische Akzente, kein Rounded.

Canonical · Toggle
Fall-Updates per E-Mail
Mila-Toggle · 36 × 20, solid ink an, #d8d8d6 aus, 14 × 14 White-Knob. Verwendet auf Kanzlei-Settings, Mandant-Konto, Vorlagen-Editor.

Der Reskin hat acht Wochen gedauert. Drei Surfaces, ungefähr fünfzig Templates, ein neuer Token-Layer, ein neuer Komponenten-Katalog. Was vorher wie ein generisches SaaS-Dashboard aussah, sieht jetzt wie ein Editorial-Produkt aus — Schriftgröße, Spacing, Hairlines, Farben.

Die wichtigste Entscheidung: kein Mode-Switch zwischen »Marketing« und »Produkt«. Die Login-Seite, das Dashboard, der Vorlagen-Editor, der Mandant-Widget — alle auf der gleichen Tokensauce. Wenn ein Kanzlei-Mitarbeiter morgens auf der Marketing-Seite war und nachmittags im Admin sitzt, soll sich das wie das gleiche Produkt anfühlen.

Was sich konkret geändert hat

  • TypeSource Serif 4 als Body-Schrift überall, mit opsz 8..60 Mapping pro Tier. Inter nur noch für Chrome, Mono für Codes.
  • ColorCream-Paper #f6f4ef als Default-Background. White nur noch für Inputs und Karten.
  • Rule0px Corners überall. Pills nur für Toggles und Status-Dots.
  • ShadowHairlines statt Shadows. Karten-Schatten entfernt, durch 1px-Rule-Borders ersetzt.
  • VoiceItalic-Akzent-Pattern: Headlines mit upright Body, italic em-Sub. Lifted aus Editorial-Register.
  • UI Vorlagen-Editor: TipTap-Mention-Extension kollidierte mit Editorial-Section-Heads. Event-Scoping mit stopPropagation gefixt.
  • UI Mobile-Nav Burger-Animation jetzt mit korrektem Timing.
  • Auth Passwordless-Login-Code-Slab: Auto-Focus nach Code-Eingang.
  • Email Postmark-Templates auf Editorial-Register umgestellt — Source Serif als Body mit Fallback auf Georgia für Mail-Clients ohne Webfont.
  • A11y Toggle-States lesbar für Screen-Reader (aria-checked).
  • Perf Source Serif 4 variable Font preloaded — FOIT auf erstem Page-View reduziert.
v1.3.6

Postmark statt Brevo.

Brevo hat Zustellungen nach Berlin verschluckt. Postmark nicht.

Postmark · Outbound Log
SENT STATUS
19·05 22:15 rechtsanwalt@kanzlei-pankow.de Delivered
19·05 22:14 m.greinke@icloud.com Delivered
19·05 22:13 immi@immi-rechtsanwaelte.de Delivered
19·05 22:08 k.agatsy@mietrecht-pankow.de Delivered
99,7 % Delivery-Rate seit Migration, ~14 s mediane Latenz. Vorher: 87 %, ~45 s, mit unerklärlichen Bounce-Spitzen am Nachmittag.

Brevo hat funktioniert — bis es nicht funktionierte. Wir hatten Wochen, in denen 13 Prozent unserer Bestätigungsmails nie ankamen, ohne Hard-Bounce, ohne Log-Eintrag. Migration ist nie sexy. Aber für ein Produkt, in dem ein verlorener Bestätigungs-Code bedeutet, dass eine Vollmacht-Signatur 24 Stunden später unterzeichnet wird statt sofort, ist Zustellrate das Produkt.

Postmark ist teurer pro Mail. Es ist auch der Anbieter, den Stripe für ihre Tx-Emails nutzt. Damit können wir leben.

v1.3.0

HARD RULE § 3: Anwalt approves alles.

Die größte Architektur-Entscheidung dieses Quartals ist auch die unbeliebteste — bei den LLM-Maximalisten. Jeder Befund, jeder Draft, jeder Send braucht eine Anwalts-Freigabe. Keine Ausnahmen.

Das ist nicht negotiable, und das ist auch nicht Conservatism — das ist Tatsachenanerkennung. Die Berufsordnung verlangt es. Die Mandanten verlangen es. Und ehrlich gesagt: das LLM ist es noch nicht wert, ohne Aufsicht ein Mandat zu führen. Vielleicht in zwei Jahren. Heute nicht.

Wie das in der Praxis aussieht

Stage 01 ist eine Acht-Schritt-Schleife: Dokumente werden hochgeladen, von der KI analysiert, in Befunde überführt, der Anwalt approves einzelne Befunde oder alle, dann approves er die nächste Stage. Stages 02, 03, 04 folgen einer ähnlichen Choreografie: Draft → Review → Approve + Send → Wait → Classify → Approve Classification + Next Stage → Route.

Was das mit der Geschwindigkeit macht: nichts. Die LLM-Arbeit ist parallelisiert. Die Anwalts-Approval-Zeiten sind Minuten, nicht Stunden. Was es mit der Zurechenbarkeit macht: alles. Jeder Befund hat einen Approver. Jeder Draft hat einen Approver. Jeder Send hat einen Approver. Wenn etwas schiefgeht, weiß man wer.