Artykuł został opublikowany także na witrynie eioba.
Wersja z 2013-02-05

Grzegorz Jagodziński

Miękkie wargowe w języku polskim

Fony, fonemy, alofony

Nikt nie ma chyba wątpliwości, że w języki polskim istnieją miękkie głoski (fony) wargowe: [p′], [b′], [f′], [v′], [m′]. Ich występowanie przynajmniej przed samogłoską [i] nie jest kwestionowane. Wątpliwości wzbudza natomiast ich status jako fonemów.

Przypomnijmy pokrótce, że mianem fonów lub głosek określamy w miarę jednorodne segmenty mowy, rozróżnialne akustycznie oraz za pomocą rozmaitych innych metod. Różnice między głoskami mogą być niekiedy bardzo drobne, nie muszą też służyć do odróżniania wyrazów i morfemów od siebie. Nauka o fonach nosi nazwę fonetyki. Fonetyczny zapis mowy umieszcza się w nawiasach kwadratowych: [a].

Fonemy są natomiast segmentami mowy o funkcji dystynktywnej: wystąpienie w takim samym otoczeniu dwóch różnych fonemów prowadzi do uzyskania dwóch różnych wyrazów. Na przykład wyrazy koń i goń różnią się tylko częścią początkową: mówimy, że w pierwszym z nich pojawia się głoska należąca do fonemu /k/, natomiast w drugim głoska należąca do fonemu /g/. Ze sposobu sformułowania tego stwierdzenia widać, że fonem rozumiany jest jako zbiór głosek. Nauka o fonemach to fonologia. Fonologiczny zapis mowy umieszcza się między ukośnikami: /a/.

Otoczeniem fonetycznym danej głoski nazywamy głoski z nią sąsiadujące. Jeśli nie istnieje takie otoczenie, by dwie podobne głoski odróżniały wyrazy od siebie, to wówczas mówimy, że obie głoski są alofonami jednego fonemu.

Na przykład w języku polskim występuje głoska [j͂] (nosowe „jot”) oraz głoska [ń]. Nie istnieje jednak takie otoczenie, by głoski te odróżniały wyrazy od siebie. Mówimy więc [koń], choć [koj͂sḱi] (<koński>; nawiasy trójkątne używane są do oddania zapisu ortograficznego). W pierwszym wyrazie [ń] występuje przed pauzą, w drugim [j͂] występuje przed szczelinową [s]. Nie da się jednak wskazać takiego przykładu, w którym w jednym wyrazie występowałoby [ń], w drugim [j͂], a poza tym wyrazy te nie różniłyby się od siebie. Jednocześnie użytkownicy polszczyzny, znający ten język od dziecka, dostrzegają coś, co obie te głoski łączy, albo wręcz w ogóle nie zdają sobie sprawy z różnicy między nimi. Możemy więc powiedzieć, że głoski [ń] i [j͂] są alofonami jednego fonemu /ń/. W konsekwencji wymowę formy wyrazowej <koński> zapiszemy fonematycznie jako /końsḱi/. Powiemy też, że [koj͂sḱi] jest sposobem realizacji formy /końsḱi/.

Uboczną konsekwencją natury alofonów jest to, że można (nieco sztucznie) zastąpić jeden drugim, a zmiana taka nie doprowadzi do nieporozumień w procesie komunikacji, co najwyżej wymowa rozmówcy stosujących takie doświadczenia wyda nam się nieco dziwna. Wymowa [końsḱi] zamiast [koj͂sḱi] może nawet ujść niezauważona: w powolnej, starannej wymowie wyrazów tego typu wymowa [ń] jest rzeczą normalną.

Zdarza się i tak, że w wymowie niektórych użytkowników języka występuje jeden alofon, podczas gdy inni w tych samych otoczeniach używają innego alofonu. Na przykład są Polacy, którzy wymawiają języczkowe [ʀ] tam, gdzie inni wymawiają językowe [r], i nie prowadzi to do utrudnień w komunikacji.

Ograniczenia w występowaniu fonemów

Dobrze, gdy dwa różne fonemy mogą wystąpić w różnych otoczeniach fonetycznych, i za każdym razem ich różnica determinuje różnicę między dwoma wyrazami. Bywa jednak i tak, że spośród dwóch różnych fonemów w danym otoczeniu może wystąpić tylko jeden, i aby ustalić, że rzeczywiście mamy do czynienia z głoskami dwóch różnych fonemów, musimy wskazać takie otoczenie, gdzie mogą wystąpić głoski jednego bądź drugiego fonemu.

Taka właśnie sytuacja występuje w języku polskim. Przed spółgłoską, na końcu wyrazu oraz przed samogłoską [y] mogą wystąpić tylko twarde głoski wargowe: [p], [b], [f], [v], [m]. Natomiast przed samogłoską [i] mogą wystąpić tylko głoski miękkie: [p′], [b′], [f′], [v′], [m′].

Przegląd różnych poglądów na fonemy wargowe

W dawniejszych opracowaniach fonologii polskiej przynależność twardych i miękkich spółgłosek wargowych do różnych fonemów uważano za oczywistą. Wskazywano przy tym na fakt, że przed samogłoskami [a], [e], [o], [u] (i samogłoskami nosowymi, uważanymi dawniej za pojedyncze głoski) mogą wystąpić zarówno [p], [b], [f], [v], [m], jak i [p′], [b′], [f′], [v′], [m′]. Nie jest trudno podać przykłady par wyrazów różniących się tylko rodzajem głoski wargowej: pasek – piasek, bały – biały, woski – wioski, mała – miała. Wydawałoby się więc oczywiste, że w języku polskim występuje 10 spółgłoskowych fonemów wargowych, 5 twardych i 5 miękkich, przy czym dystrybucja miękkich i twardych fonemów podlega dość znacznym ograniczeniom. Koncepcję taką można by nazwać hipotezą fonologicznej odrębności i monofonematyczności miękkich wargowych.

Zwrócono jednak także uwagę na fakt, że polskie miękkie wargowe różnią się sposobem artykulacji od podobnych fonemów występujących np. w języku rosyjskim, a mianowicie artykulacja głosek polskich jest, a przynajmniej zwykle bywa, asynchroniczna. Oznacza to, że o ile w języku rosyjskim podniesienie języka ku podniebieniu występuje od początku artykulacji głoski miękkiej, o tyle w polskim ten dodatkowy ruch artykulacyjny występuje z opóźnieniem. Pojawiło się podejrzenie, że w rzeczywistości to, co uważano za miękkie fonemy wargowe przed samogłoską, jest grupą dwóch fonemów: spółgłoski wargowej i fonemu /j/. Koncepcję taką można by nazwać hipotezą bifonematyczności miękkich wargowych.

W roku 1966 Z. Stieber w Historycznej i współczesnej fonologii języka polskiego zaprezentował opinię, że taka analiza nie jest adekwatna do faktów językowych. Uzasadniał on fonematyczność miękkich wargowych twierdząc, że w języku polskim wymowa synchroniczna (typu [m′a]) skontrastowana jest z asynchroniczną (typu [m′ja]). Jako przykład takiej różnicy podawał opozycję drugiej sylaby wyrazów <ziemia> i <armia>, które według niego są wymawiane [źem′a] i [arm′ja]. Koncepcję taką można by nazwać hipotezą zróżnicowanej natury miękkich wargowych.

Większość nowszych autorów odrzuca jednak poglądy Stiebera. Dobrym przykładem publikacji, w której w ogóle podjęto próbę przedyskutowania problemu, jest Fonetyka konfrontatywna polsko-serbsko-chorwacka I. Sawickiej (zob. literatura). Analizując przykłady <ziemia> i <armia> autorka przyznaje, że „teoretycznie istnieje tu pewna możliwość zróżnicowania wymowy, nie tylko poprzez ewentualne zachowanie twardości /m/ w drugim przykładzie i wyrazistszą artykulację /j/, lecz także poprzez zintegrowanie [m′] z [j] w [źem′ja] za pomocą przedłużonego rezonansu nosowego: [m′j͂]. Zjawisko takie nie występuje jednak w wymowie polskiej, a realizacja ostatniej sylaby w obu przykładach jest identyczna” (w cytacie zmieniono oryginalne oznaczenia na zgodne z konwencją stosowaną w tym artykule). Dalej Sawicka analizuje jeszcze możliwość wymowy wyrazu <biologia> jako [b′ijoloǵja] i uważa ją za stojącą poza normą i niereprezentatywną dla polszczyzny. Koncepcję Sawickiej można określić jako hipotezę jednolitej bifonematycznej natury miękkich wargowych.

Analiza poglądu o jednolitej bifonematycznej naturze miękkich wargowych

Wielu współczesnych lingwistów przyjmuje hipotezę prezentowaną przez Sawicką jako rodzaj dogmatu. Nawet w Poradni Językowej PWN udzielono niedawno następującej porady:

Z badań fonetyków wynika, że zarówno w wyrazach rodzimych typu ziemia, jak i w wyrazach zapożyczonych typu chemia wymawiamy w ostatniej sylabie jotę, tzn. mówimy [źem′ja] i [xem′ja]. Wynika stąd, że wymienione wyrazy się rymują.

Każdego myślącego człowieka zainteresowanego tematem musi jednak zastanawiać, dlaczego Sawicka w swojej publikacji nie odwołuje się do żadnych badań eksperymentalnych, nie stara się nawet poprzeć swoich twierdzeń odniesieniami do literatury, którymi poza tym najeżona jest jej praca. Biedrzycki (1978:79) wspomina o badaniu wyrazów ja, wjazd, wiatr i o takim samym stosunku ja do wiatr jak łaski do właz, milczy jednak na temat rzekomej identyczności nagłosu wjazd i wiatr, choć kontekst, w jakim podaje te przykłady, zdaje się to sugerować. Okazuje się zatem, że badania fonetyków, według których jakoby „zarówno w wyrazach rodzimych typu ziemia, jak i w wyrazach zapożyczonych typu chemia wymawiamy w ostatniej sylabie jotę” są w rzeczywistości miejską legendą, zwykłym mitem. Nie tylko autorowi tego tekstu nie udało się do nich dotrzeć. Wybitni fonetycy i propagatorzy tego poglądu także nie są w stanie takich publikacji wskazać. Prawdopodobnie tak naprawdę Sawicka nie opiera się więc na żadnych „badaniach fonetyków”, ale na swoich osobistych przeświadczeniach.

Niewątpliwie zgodzić się należy, że wymowa [b′ijoloǵja] nie jest reprezentatywna, i w ogóle nie może być tutaj dyskutowana. Prawdą jest także, że istnieje możliwość zróżnicowania wymowy, co przecież Sawicka przyznaje. Natomiast rzeczą problematyczną jest, czy rzeczywiście takiego zróżnicowania nie obserwujemy w języku polskim. Autor niniejszego tekstu w tym miejscu zupełnie nie zgadza się z prof. Sawicką.

Paradoksalnie dwa akapity wyżej sama autorka przeczy sobie i przyznaje, że zróżnicowanie wymowy nie tylko jest możliwe, ale rzeczywiście występuje w języku polskim, choć w nieco innym kontekście. O ile bowiem Biedrzycki zdaje się sugerować, że nagłos wyrazów wiatr i wjazd jest taki sam, o tyle Sawicka wyraźnie nie zgadza się z tym poglądem. Mianowicie autorka ta wskazuje, że wyrazy obiecać i objętość różnią się nagłosem, a przynajmniej mogą się różnić w powolnej wymowie. W pierwszym wypadku dochodzi bowiem do zmiękczenia [b], w drugim spółgłoska ta pozostaje twarda. Aby oddać tę różnicę na poziomie fonologicznym, Sawicka transkrybuje, mutatis mutandis, /#objecać/ oraz /#ob#jentość/, tj. jej zdaniem do zmiękczenia /b/ w wyrazie objętość nie dochodzi z powodu obecności junktury w miejscu szwu morfologicznego. Autorka tym samym przyznaje, że na poziomie fonetycznym możliwe jest zróżnicowanie sekwencji [obje] i [ob′je], a w ślad za takim zróżnicowaniem musi istnieć różnica fonologiczna, gdyż chodzi o dokładnie takie samo otoczenie fonetyczne. Jej interpretacja, wiążąca opisywaną różnicę z obecnością junktury, jest jednak trudna do zaakceptowania. A w szczególności wątpliwej prawdziwości wydaje się być pogląd, że różnica wymowy zachodzi między obie a obje, natomiast nie zachodzi między Dubia (D lp od Dubie) a dubia (‘rzeczy wątpliwe’). Rodzi się też podejrzenie, że mamy tu do czynienia z interferencją ortografii, a nie z wynikami badań, które upoważniałyby do takich a nie innych wniosków.

Zapewne przeprowadzono rzeczywiście badania dotyczące ewentualnych różnic w wymowie wyrazów ziemia i armia, analizowanych przez Stiebera (choć nie można nigdzie znaleźć danych bibliograficznych związanych z nimi publikacji). Okazało się, że te dwa konkretne wyrazy rzeczywiście się rymują. Popełniono jednak rażący błąd metodologiczny: na jednostkowej podstawie wysunięto zupełnie nieuprawniony wniosek, że rymują się wszystkie inne tego typu wyrazy. W szczególności zaś nie porównywano wymowy wyrazów w rodzaju obie, obje, Dubia, dubia, a zatem interpretacja zaproponowana przez Sawicką jest całkowicie bezpodstawna.

Jest więc zatem tak, że na podstawie obserwacji, dokonanej przez jeden z czołowych autorytetów, powstał mit wymowy miękkich wargowych z jotą. Mit ten poparły bez sprawdzenia inne autorytety, i obecnie urósł on do rangi naukowego pewnika. Tymczasem jego podstawy są bardzo wątłe. Jest rzeczą znamienną, że na propozycję eksperymentalnego sprawdzenia kwestionowanego twierdzenia jedna z osób propagujących ten mit zareagowała w sposób nieoczekiwany – mianowicie stwierdziła, że dojście do prawdy jej nie interesuje i nie będzie w tym brać udziału. Taka postawa powinna zrodzić podejrzenie, że tak naprawdę świadomi głosiciele hipotezy jednolitej bifonematycznej natury miękkich wargowych (jak Sawicka) zdają sobie doskonale sprawę z nieprawdziwości głoszonych przez siebie tez, ale brak im chęci lub odwagi, by przyznać, że się mylą.

Oczywiście taka poszlaka nie ma jeszcze sama właściwie żadnej mocy dowodowej. Powinna jednak przekonać, że problem wcale nie jest wyjaśniony do końca, i że warto poświęcić czas dla jego dogłębniejszej analizy.

Przykłady możliwych kontrastów

U podstaw przekonań o jednakowej naturze miękkich wargowych stoi, jak przekonaliśmy się, fatalnie dobrany przykład pary ziemia – armia. Spróbujmy jednak zastanowić się, czy nie można wyszukać lepszych par do analizy.

Stieber uważał, że grupy spółgłoska miękka + /j/ występują w wyrazach pochodzenia obcego, podczas gdy spółgłoski miękkie bez /j/ znajdziemy w wyrazach rodzimych. Odbiciem tej różnicy jest pisownia wyrazu w formie z końcówką -i: w przykładzie Stiebera ziemi, ale armii. Aby uniknąć problemów, warto skupić się tylko na tych wyrazach, w których wargowa następuje po samogłosce (armia nie spełnia tego warunku). Oto lista przykładów par minimalnych, tj. form wyrazowych różniących się tylko domniemanym brakiem lub obecnością /j/ po wargowej.

miękka wargowa   wargowa + /j/
kopie, 3 lp od kopać   kopie, lm od kopia
rupia, D od rup ‘rzęch’   rupia ‘jednostka monetarna’
utopię, 1 lp od utopić   utopię, B od utopia
Arabie, MsW od Arab   Arabie, lm od Arabia
Dubia, D od Dubie   dubia ‘rzeczy wątpliwe’
fotografie, MsW od fotograf   fotografie, lm od fotografia
rafie, CMs od rafa   rafie, lm od rafia (roślina)
sofie, CMs od sofa   Sofie, lm od Sofia (imię)
pawia, D od paw   Pawia ‘miasto we Włoszech’
lamie, CMs od lama   Lamie, lm od Lamia (imię)
ramie, CMs od rama   ramie, lm od ramia (roślina)
ramię ‘część ciała’   ramię, B od ramia (roślina)

Spółgłoska /j/ powinna także wystąpić na początku rdzenia wyrazu po przedrostku ob- lub w-. Oddaje to zresztą pisownia.

miękka wargowa   wargowa + /j/
obie, ż od oba   obje, od objeść
obiedzie, MsW od obiad   objedzie, od objechać
wiedzie, od wieść   wjedzie, od wjechać

Podobna sytuacja występuje po przyimku, co także jest odzwierciedlone w pisowni.

miękka wargowa   wargowa + /j/
wianie (wiatru)   w Janie
wieża   w jeża
wionie, od wionąć   w jonie
wiórze, MsW od wiór   w jurze

Istnieje jeszcze jeden kontekst, pozwalający wyłowić ewentualne różnice między obiema grupami Stiebera. Trzeba jednak wcześniej wyjaśnić, że enklityki wymawiane są na ogół łącznie z poprzedzającym wyrazem niosącym akcent. Mimo rozdzielnej pisowni w takich grupach jak daj mi, poznaj go, kochaj ją w zasadzie nie jest możliwe zrobienie pauzy, i całość można porównywać z pojedynczymi wyrazami.

Pojawia się jednak pewien problem. Otóż wyrazy kończące się w zapisie ortograficznym spółgłoską właściwą wymawiane bywają rozmaicie w zależności nie tylko od dźwięku rozpoczynającego następny wyraz, ale i od regionu Polski. I tak, w swobodnej mowie większość mieszkańców Pomorza i Mazowsza grupy łap je, zwab je wypowie [wap je], [zvap je] (a więc z [p] niezależnie od pisowni), natomiast w Wielkopolsce i Małopolsce spotkamy raczej wymowę [wab je], [zvab je] (czyli z [b] niezależnie od pisowni). Podobne zjawisko nie występuje wewnątrz wyrazu, dlatego podane niżej przykłady mogą wykazywać także różnicę dźwięczności spółgłoski. Różnice te można zniwelować, starając się wymówić wyraz zgodnie z ortografią, co zdarza się i w żywej mowie. Poza tym końcowe ortograficzne <-ę> należy wymawiać jako zwykłe [e].

miękka wargowa   wargowa + /j/
łapie   łap je
kopie   kop je
zwabią   zwab ją
grabie   grab je
trafią   traf ją
skrzywię   skrzyw je
zmówią   zmów ją
łamią   łam ją
znamię   znam je

Gdyby rację mieli zwolennicy hipotezy jednolitej bifonematycznej natury miękkich wargowych, wyrazy umieszczone w lewej kolumnie w każdym z powyższych zestawień powinny być wymawiane dokładnie tak samo, jak odpowiadające im formy i grupy wyrazów z kolumny prawej. Gdyby z kolei rację miała Sawicka, istniałaby (przynajmniej w wolnej wymowie) różnica między obie a obje, ale nie między Arabie (wołacz od Arab) a Arabie (liczba mnoga od Arabia). Warto się przekonać, czy tak jest, choćby wsłuchując się w swoją własną wymowę.

Metody badania

Zwykły komputer nawet bez specjalistycznego oprogramowania pozwala stwierdzić, że wyrazy ziemia i chemia się nie rymują, wbrew temu, co twierdzi Poradnia PWN. Wystarczy nagrać swoją własną wymowę tych wyrazów, a lepiej par podanych w poprzednim rozdziale, a następnie porównać zapisane obrazy fali dźwiękowej. Okazuje się, że segmenty odpowiadające ortograficznym m oraz i są krótkie w wyrazach ziemia, lamie, łamią, a długie w wyrazach i grupach chemia, Lamie, łam ją. Warto to sprawdzić samemu: takie doświadczenie nie trwa więcej niż parę minut. Potwierdza to oczywiście także indywidualna analiza percepcyjna (pod warunkiem, że ktoś ma tzw. wyrobione ucho).

A dokładniej, podane wyrazy nie rymują się w wymowie przeważającej większości Polaków, w tym w wymowie spikerów telewizyjnych i radiowych. Są Polacy, którzy rzeczywiście nie czynią różnicy między wyszczególnionymi wyrazami – podobnie jak są Polacy, którzy zamiast pijany wymawiają pjany, albo zamiast biologia wymawiają bijologia. Są i tacy, którzy rzeczywiście wiatr, piasek wypowiadają wjatr, pjasek, tak jak to zapisują fonetycy powtarzający niesprawdzone mity. Wyrobione ucho takie osobliwości wychwytuje od razu. Przedmiotem analizy jednak jest język literacki, a nie zepsute idiolekty – takimi wykolejeniami nie należy się po prostu zajmować.

Wymowa asynchroniczna

Zgodnie z tym, co twierdzą przeciwnicy Stiebera, w wymowie przeważającej większości Polaków miękkie wargowe wymawiane są asynchronicznie, to jest że segmenty odpowiadające ortograficznym m oraz i są łatwo wyodrębnialne. Świetnie zauważają to np. Rosjanie, w których języku, jak wspomniano wyżej, są miękkie wargowe synchroniczne. Widocznie jednak większość osób zajmujących się tym problemem nie jest zupełnie w stanie zrozumieć prostej sprawy: wymowa asynchroniczna niekoniecznie oznacza od razu sekwencję dźwięków [m] + [j]. Sam fakt wymowy asynchronicznej nie może stanowić dostatecznej podstawy, aby mówić o sekwencji dwóch fonemów. Sawicka (1988:40) zresztą także podkreśla, że „asynchroniczność jest cechą wielu fonemów”.

Jako dobrą analogię różnicy wymowy ostatniej sylaby wyrazów ziemia i chemia można podać różnicę pomiędzy czy a trzy. Zarówno mi w ziemia, jak i cz w czy są asynchroniczne, tj. można w nich łatwo wydzielić segmenty (w wypadku czy segmentami tymi są [t] i [š]). Mimo to zachowana jest różnica między miękkim asynchronicznym [m′] w ziemia a sekwencją dźwięków [mj] w chemia. Istotę tej różnicy wyjaśniła dogłębnie Sawicka. Zapis [m] jako spółgłoski twardej nie jest tu błędem, gdyż ma za zadanie podkreślić większy stopień asynchronii. Analogicznie zachowana jest różnica między afrykatą zapisywaną w transkrypcji slawistycznej jako č (uznanej za sekwencję dwóch dźwięków w zapisie międzynarodowym IPA) a sekwencją [t] + [š] w trzy.

Pomocniczym, praktycznym testem różnicy stopnia asynchroniczności może być także próba podziału wyrazów na sylaby. Rzeczywiste miękkie wargowe, mimo asynchronicznej wymowy, nie ulegają nigdy podziałowi, np. forma zarabia może być podzielona tylko za-ra-bia. Natomiast grupy wargowa + j mogą zostać rozdzielone granicą sylaby lub nie, np. Arabia można podzielić A-rab-ia lub A-ra-bia. Tak samo formę obie można podzielić tylko o-bie, natomiast formę obje można podzielić ob-je lub o-bje. Różnica ta odbija stopień asynchroniczności w obu przypadkach, i jednocześnie pokazuje, że nie ma znaczenia ani ortografia, ani (wbrew Sawickiej) podział morfologiczny wyrazu.

Gussmann (2007:40–41) zauważa dodatkowo, że istnieją odmiany polskiego i polskie gwary, w których miękkie wargowe wymawiane są (w wyrazach odziedziczonych) „glide-less”. Jednakże taka wymowa nie jest możliwa w słabiej przyswojonych zapożyczeniach, jak biografia, fobia, mafia, rewia, infamia. Spostrzeżenie to również świadczy o tym, że ortograficznym <pi>, <bi>, <fi>, <wi>, <mi> przed samogłoską odpowiadają dwa różne typy wymowy, zależne od wyrazu.

Wymowa mniej asynchroniczna (bez /j/) występuje nie tylko w wyrazach rodzimych i w przyswojonych zapożyczeniach, ale także w określonych formach gramatycznych wyrazów, np. trafię, Arabie, fotografie (MsW od Arab, fotograf). Natomiast wymowa bardziej asynchroniczna (z /j/) występuje regularnie w rzeczownikach zapożyczonych zakończonych w formie słownikowej na -ia, typu utopia, Arabia, fotografia, Pawia, Lamia. Redukcja /j/ prowadząca do wymowy pierwszego typu (mniej asynchronicznej) występuje jednak, gdy wargowa występuje po spółgłosce, szczególnie w wyrazach lepiej przyswojonych: harpia, Sylwia, szałwia, relikwia, armia, Warmia. W leksyce specjalistycznej i w wyrazach mniej popularnych /j/ jednak pozostaje: entalpia, partenokarpia, euforbia, ralfia, mezomorfia, oftalmia, heterospermia, homojotermia, geotermia, surmia, ketmia, arytmia.

Można więc ostatecznie skonkludować, że Stieber miał w zasadzie rację, z tym że różnica między dwiema analizowanymi przezeń grupami nie leży w synchronii i jej braku, ale w stopniu asynchronii i długości segmentów. Taką koncepcję będziemy określać mianem zmodyfikowanej hipotezy Stiebera.

Różnica wymowy a morfologia wyrazu

Różnica między miękkimi wargowymi a grupami złożonymi z wargowych i spółgłoski /j/ (wyraźnie istniejąca i słyszalna, choć negowana przez niektórych na podstawie mitów i legend) znajduje doskonałe odzwierciedlenie w morfologii. Mianowicie wyrazy o tematach zakończonych na miękką wargową przybierają końcówkę -i, które zawsze zmiękcza wargową (na poziomie fonetycznym) i dlatego nie jest potrzebny dodatkowy segment zmiękczający, np. [źem′a] : [źem′i], ortograficznie <ziemia> : <ziemi>. Natomiast w wyrazach o tematach zakończonych na grupę ze spółgłoską /j/ nie dochodzi do opuszczenia tego [j] przed końcówką -i, w wyniku czego w ortografii pojawiają się dwa „i”, np. [xemja] : [xemji], ortograficznie <chemia> : <chemii>.

Warto podkreślić, że fonetycy nie negują odrębności [źem′i] od [xemji]. Innymi słowy, nawet jeśli bezpodstawnie twierdzą, że ziemia i chemia się rymują, to jednocześnie także twierdzą (słusznie), że formy ziemi i chemii się nie rymują. Tej morfologicznej różnicy nie potrafią w żaden sposób wyjaśnić, i nawet nie próbują tego robić, przemilczając problem. Zmodyfikowana interpretacja Stiebera, poparta analizą akustyczną i danymi doświadczalnymi, dostarcza natomiast przekonującego wyjaśnienia.

Ponadto warto podkreślić, że zdaniem krytyków Stiebera możliwa jest różnica np. [m′] : [mj] przed [i] (ziemi : chemii), ale nie przed inną samogłoską. Takie dziwne ograniczenie dystrybucji brzmi po prostu niewiarygodnie.

Pułapki

Przykład analizowany przez Stiebera był łatwy do obalenia przez przeciwników jego koncepcji, gdyż był fatalnie dobrany. Ortografia bywa bowiem niekiedy myląca, a wymowa niektórych wyrazów podlega ewolucji. I tak, istnieje grupa dobrze przyswojonych wyrazów obcego pochodzenia o tematach zakończonych na miękką wargową następującą po innej spółgłosce, które mają obce pochodzenia i są w dopełniaczu zapisywane z dwoma „i”, mimo że wymawia się [i], a nie [ji]. Należy tu właśnie wyraz armia (dopełniacz <armii> [arm′i], a nie [armji]), który był przyczyną powstania uporczywie powtarzanego mitu. Można by tu wymienić także takie wyrazy jak Warmia, Sylwia, szałwia i szereg innych. Pisownia armii, Warmii, Sylwii, szałwii jest więc czysto arbitralna i nie oddaje wymowy.

Zupełnie nie zauważają problemu normatywiści. WSPP podaje wciąż, że armii należy wymawiać wyłącznie jako [armji], a nie jako [arm′i]. Zdarzają się też wypadki przeciwne: rzadko używany wyraz odziedziczony, który powinien być wymawiany z miękką wargową, wymawiany jest z grupą z [j]. Najbardziej charakterystycznym przykładem jest tu wyraz konopie. Zamiast oczekiwanej wymowy [konop′e] powszechnie słyszy się [konopje]. W konsekwencji zamiast [konop′i] mamy [konopji], co mówiący zapisują ze słuchu jako <konopii>. Ten błąd ortograficzny (powtarzany nawet – o zgrozo! – przez autorów niektórych słowników) pośrednio dowodzi, że argument morfologiczny istnienia omawianej w tym artykule różnicy jest argumentem bardzo poważnym.

Zdaniem prof. Miodka wymowa z grupą z [j] rozprzestrzenia się także w innych wyrazach, w których nie powinno być [j], w tym tak często używanych jak ziemia. W tym nagannym i niepokojącym zjawisku widzi przyczynę szerzenia się błędu ortograficznego ziemii zamiast ziemi. Można domyślać się, że pisownia taka ma oddawać błędną wymowę [źemji] będącą konsekwencją błędnej wymowy [źemja] zamiast [źem′a]. Czy spostrzeżenie Miodka jest słuszne, nie wiadomo. W rzeczywistości bowiem wymowa [źemja] i [źemji] wydaje się zjawiskiem zupełnie marginalnym. W każdym razie nie słyszy się jej zupełnie w środkach masowego przekazu, ani też w wymowie mieszkańców przynajmniej pewnych regionów kraju.

Autorzy WSPP mimo bezkrytycznego przenoszenia ortografii na wymowę nie ulegli presji powtarzających mity fonetyków, i odróżniają wyraźnie wymowę typu ziemia od wymowy typu chemia. Każdy, kto powtarza tezę o nieistnieniu w języku polskim odrębnych fonemów wargowych, powinien więc zdawać sobie sprawę, że wyraża tym samym pogląd niezgodny z treścią słownika poprawnościowego.

Bibliografia