Istini za volju, ne postoji jedinstvena definicija foneme, čak neke fonološke teorije ni ne poznaju taj koncept. Ali u nekoj standardnoj lingvističkoj teoriji, to bi bila apstraktna jedinica jezičkog izraza, i to najmanja takva jedinica koja ima distinktivnu vrednost. Foneme se realizuju putem fonova, i svakoj pojedinačnoj fonemi, kao apstraktnoj jedinici, odgovara praktično kontinuum fonova, kao konkretnih (akustičkih) realizacija date foneme.
Alofoni su takođe apstrakne jedinice, ali nižeg ranga od foneme. Alofonima jedne foneme se zovu takve jedinice koje su u komplementarnoj distribuciji, što će reći da se u datom, ma kom, glasovnom kontekstu može pojaviti ili jedna ili druga varijanta, nikako obe, i koje, prema tome, nemaju distinktivnu vrednost jedna u odnosu na drugu.
Slikovito rečeno, foneme su kao kutije (ili kućice, kako kaže Jape), kojih ima ograničen, tačno određen broj, i koje su one osnovne, underlying, jedinice koje mi koristimo kada komuniciramo jezikom. Svaka ta kutija može imati jednu ili više pregrada. Svaki pregrađen deo predstavlja alofon date foneme. Ako kutija nema pregrada, onda se može reći da fonema ima jedinstven alofon, i u tom smislu svaka fonema ima bar jedan, a moguće i više, alofona. Zato alofona ima više nego fonema.