Staroperzijski jezik pripada indoiranskoj skupini jezika, koji pripadaju indoeuropskoj skupini jezika, zajedno i s hrvatskim, koji je slavenski jezik, koji pripada baltoslavenskoj porodici indoeuropskih jezika. Svi su jezici jedne porodice nastali iz istoga prajezika, odnosno međusobno su srodni. Staroperzijski pripada staroiranskoj potporodici indoiranskih jezika, zajedno s avestičkim (sjeveroistočni Iran) i medijskim (sjeverozapadni Iran), dok se staroperzijski govorio u jugozapadnome Iranu.
Glavni su korpus staroperzijskoga jezika ahemenidski tekstovi, odosno natpisi Ahemenidskoga Carstva, pri čemu su tu najpoznatiji vladari kao što su Kambis, Kserkso, Artakserkso I., II., III. i IV., potom Darej I., II. i II. te Arsam. Najstariji su staroperzijski spomenici iz Behistuna – iz vremena Dareja I. Spomenici su uglavnom natpisi Dareja Velikoga (521. – 486. p. n. e.) i Kserksa (487. – 465. p. n. e.). Na staroperzijski su jezik utjecali i drugi jezici i kulture, posebice po različitim imenima mjesta i ljudi, odnosno toponimima i antroponimima, a postoje i neke aramejske riječi i utjecaj na gramatiku, primjerice kratke rečenice, ponavljanje ključnih riječi te anakolutično (gramatički nekonzistentno) uvođenje imena mjesta i ljudi u rečenicu. Međutim, glavni utjecaj čini medijski jezik, posebice što se tiče fonoloških posebitosti i glasovnih zakonitosti.
Pismo staroperzijskoga jezika jest klinopis, na kojemu je najviše radio Georg Friedrich Grotenfed 1802. godine, koji je uspoređivao Darejev i Kserksov natpis, što je označilo početak dešifriranja staroperzijskoga pisma, na kojemu su dalje radili Christian Lassen i Eugène Burnouf. Pismo se sastoji od 36 znakova, 5 ideograma (slikovnih znakova), te od ligatura ideograma i padežnoga nastavka, a tu su i razdjelnici riječi te brojke.
Smatra se da se pismo stvorilo oko 525. godine p. n. e. kako bi Darej I. imao pismo za natpise u Behistunu. Perzijski je klinopis, za razliku od npr. akadskoga, uglavnom fonetsko pismo, odnosno nije slogovno. Taj klinopis zapravo i nema veze s akadskim, elamitskim, hurijskim te hetitskim klinopisom u smislu posuđivanja ili porijekla te se smatra zasebnom inovacijom. Staroperzijski tekstovi pisani su na kamenu i grubim materijalima, a ne na glinenim pločicama, a pisalo se slijeva nadesno.
Što se tiče staroperzijske fonologije, posjedovao je tri vokala s dugim i kratkim inačicama: a, i i u, uz diftonge ai i au. Posjeduje zvučne i bezvučne okluzive: b, d, g, p, t, k te dentalno th (obično se označava grčkom thetom θ). Tu su i palatali c i j [č, dž] te ç kao bezvučni sibilant (nastao od *tr). Nazali su m i n, frikativi s, š, z, f, x (zvučno h), a likvidi r i l, uz poluvokale y i v.
Imenice mogu imati mnoštvo deklinacija, a padeži su nominativ, genitiv, akuzativ, vokativ, lokativ, instrumental i ablativ. Dativnu je funkciju preuzeo genitiv. Deklinacije se određuju prema završetku osnove (npr. kao i u hrvatskome žena označit će da se deklinira kao žena, žene (e-deklinacija), a ne kao vino, vina (a-deklinacija). Tako da postoje različiti padežni nastavci za različite osnove, koje mogu biti muške o-osnove, potom ženske osnove na dugo a, zatim osnove na kratko i dugo i i u (i hrvatski ima osnove na i, usp. npr. noć, noći), a tu su i dvoglasne i konsonantske osnove. Zamjenice mogu biti lične, odnosne, pokazne, upitno-neodređene, uz povratnu zamjenicu i zamjeničke pridjeve. Primjera radi, lične su zamjenice adam = “ja”, potom tuvam = “ti” te ša- i ši- za 3. lice, odnosno “on” i “ona.
Glagoli od vremena imaju prezent, aorist, perfekt i imperfekt, a od stanja imaju aktiv, medij (određena povratna vrsta radnje, slična pasivu) i pasiv. Od načina tu su indikativ, konjunktiv, optativ (željni način, usp. hrv. živio! što nije perfekt), injunktiv (neobilježeni način, za bilo koje vrijeme) i imperativ. U sintaksi se obično umjesto nepostojećega dativa rabi genitiv. Akuzativ se rabi za cilj, mjesto (usp. hrvatski idem u grad, ali lokativ ja sam u gradu) te za trajanje vremena (usp. hrv. svaki dan to radim). Ablativ se rabi za kretanje iz čega, a za ostale mjesne odrednice rabi se lokativ, katkad i instrumental.