Das Orthografische Kernkorpus (OKK) ist speziell auf die Arbeit des Rats für deutsche Rechtschreibung und die entsprechende Orthografie-Forschung ausgerichtet, wurde in der Geschäftsstelle des Rats für deutsche Rechtschreibung am Leibniz-Institut für Deutsche Sprache (IDS) zusammengestellt und umfasst rd. 14 Mrd. Wortformen.
Das OKK enthält in relativer fachspezifischer, allgemeinsprachlicher und regionaler Ausgewogenheit repräsentative Daten aus Zeitungs- und Zeitschriftentexten aller Länder und Regionen mit Deutsch als Amtssprache. Diese Daten „professionell Schreibender“ bilden die Grundlage für valide orthografische Erhebungen und Auswertungsergebnisse sowohl des etablierten Wortschatzes wie auch von Neologismen im aktuellen Fremdwortschatz des Deutschen. Sie werden in einem diachronen Verfahren der Jahrgänge von 1995 – dem Jahr vor der Rechtschreibreform – bis zum aktuellen Jahrgang erfasst und vergleichend ausgewertet, um so das Verhältnis des Schreibgebrauchs zur Norm zu ermitteln. Über diesen Zeitraum von fast 30 Jahren hinweg ist es in der Regel möglich, zuverlässig zu entscheiden, ob der mehrheitliche Schreibgebrauch der fixierten Norm entspricht oder ob es Abweichungen gibt, sowie welche Schreibweise im Fall von zulässiger Varianz von den Schreibenden präferiert wird.