Der CAT2-Formalismus ist in Bezug auf das Modell der Übersetzung völlig frei. Er läßt sowohl transferbasierte Lösungen, als auch Interlingua oder direkte Übersetzung zu. Die semantische Analyse kann getrennt von der syntaktischen erfolgen, oder in diese integriert sein. Die Realisierung eines bestimmten Modells ist die Aufgabe des Grammatikschreibers.
Die bestehenden Grammatiken verwirklichen den tranferbasierten Ansatz. Die syntaktische und semantische Analyse wird gleichzeitig auf der Konstituentenebene durchgeführt. Durch die Einbeziehung von semantischen Aspekten in die syntaktische Analyse, können strukturelle Mehrdeutigkeiten früher aufgelöst werden.
Die Interface-Struktur ist so konzipiert, daß sie eine Einzelübersetzung jeder der Hauptbestandteile des Satzes zuläßt und es Aufgabe des syntaktischen Generators der Zielsprache ist, die resultierende Zielstruktur zu überprüfen. Dieses Transferverfahren liegt zwischen einem normalen wortbasierten Transfer und einer Interlingua, wobei die Nachteile beider Verfahren vermieden werden.
Um den Regelsatz übersichtlicher zu gestalten, wurden zwischen der syntaktischen Ebene jeder Sprache und ihrer Interface-Ebene, zwei weitere relationale Repräsentationsebenen eingeführt. Die Bezeichnung der Repräsentationsebenen, Tabelle \ref{Bezeichnung}, ist standardisiert. Sie setzt sich aus vier Buchstaben zusammen. Die ersten beiden Buchstaben kennzeichnen die Art der Repräsentationsebene, während die beiden anderen die jeweilige Sprache bezeichnen.
Viele Sprachen wurden während der Entwicklung von CAT2 getestet. Gegenwärtig existieren große Grammatiken und Lexika für Englisch, Deutsch, Spanisch, Französisch und Dänisch. Beispielhaft soll in Tabelle \ref{Anzahl} der Umfang einer solchen Grammatik am Beispiel des Deutschen dargestellt werden. Auffällig ist dabei die im Vergleich zur syntaktischen Ebene relativ geringe Zahl von B-Regeln in den relationalen Beschreibungsebenen und die sehr häufige Verwendung von F-Regeln. Außerdem ist erkennbar, daß sich die Translatoren bei Analyse und Synthese hinsichtlich der Anzahl der verwendeten T-Regeln stark unterscheiden.
Je nach Entwicklungsstadium existieren für jede Sprache verschiedene Lexika. Kann bereits eine externe Morphologie verwendet werden, gibt es jeweils ein morphologisches Lexikon für Wörter der geschlossenen und der offenen Klassen.
Für die Wörter der offenen Klassen wird ein weiteres Lexikon verwendet, welches von allen Repräsentationsebenen, außer der morphologischen Ebene, genutzt wird. Verben und ihre nominalen Derivate werden in diesem Lexikon durch einen Lexikoneintrag repräsentiert. Diese Lexikoneinträge werden durch atomare B-Regeln gebildet.
Außerdem existieren Transferlexika. Diese sind Bestandteil von Translatoren zwischen Interface-Strukturen verschiedener Sprachen und bestehen aus sehr einfachen T-Regeln.
Beispiel 8: Einfache Regeln im Transferlexikon de-en.lex
lex = {lex=erzwingen,head={pref=nil,refl=nil},clex=nil}.[] <=> {lex=enforce,part=nil,head={complex={lex=nil}}}.[]. lex = {lex=zwingen,head={pref=nil,refl=nil},clex=nil}.[] <=> {lex=compel,part=nil,head={complex={lex=nil}}}.[]. lex = {lex=zwingen,head={pref=nil,refl=nil},clex=nil}.[] <=> {lex=force,part=nil,head={complex={lex=nil}}}.[].
In den Grammatikregeln und den Lexikoneinträgen werden lexikalische bzw. phrasale Strukturen durch ihre linguistischen Merkmale beschrieben. Für diese Merkmale existiert ein System, d.h. es ist festgelegt, welche Merkmale eine Merkmalsstruktur besitzt, welche Werte diese Merkmale annehmen können und welche Semantik sich hinter Merkmal und zugehörigem Wert verbirgt. Diese allgemeine Merkmalsstruktur wird nicht durch den CAT2-Formalismus bestimmt, sondern ausschließlich durch die Grammatik und das Lexikon.