Српски језички атеље

Српски језички атеље => Језик и информатика => Тему започео: Orlin у 8. 04. 2012. у 09.33

Наслов: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Orlin у 8. 04. 2012. у 09.33
Здраво свима! Претпостављам да jе пресловљавање из српске ћирилице у српску латиницу без проблема jер сваком ћириличном слову jеднозначно одговара слово или диграф у латиници. Има ли заиста таквих програма?
Сасвим jе друга ствар пресловљавање у супротни смер пошто диграфи и nj немаjу jеднозначан еквивалент у ћирилици мада jе jедна вариjанта транслитерациjе сваког од ових диграфа много фреквентниjа од друге: нпр. 99% џ, њ и 1% дж, нj. Проблем jе и изворно писање страних имена - ако jе аутор написао Shakespeare и Victor Hugo, добићемо Схакеспеаре [lol] и Вицтор Хуго [lol] ако не исправимо. Да ли има смисла у таквом случаjу творити програме за транслитерациjу у ћирилицу ако би требало да исправљамо резултат? Користи ли се у пракси таква аутоматска транслитерациj? Jе ли то основни разлог да се не препоручуjе изворно писање?
Хвала унапред!
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 8. 04. 2012. у 10.06
Ima ideja da se naprave i programi za transkribovanje. Na njiki je bilo ljudi koji su to probali. Čini mi se da su najdalje otišli s nemačkim, ali ne znam šta je na kraju bilo. Postoje programi za transliteraciju u oba smera, npr. http://ikiprev.com/ (http://ikiprev.com/) koji ima ne samo prebacivanje pisma, nego i narečja —  ekavica:ijekavica —  i radi dosta dobro, mada ne znam koliko je usavršen. Ja taj program koristim na mojim sajtovima za prebacivanje pisma. Npr. Na SJA imamo u gornjem desnom uglu "Latinica" kad klikneš, stranica se promeni u latinicu preko IKI prevodioca i možeš da nastaviš da se krećeš po sajtu u latinici.

Što se tiče drugog pitanja, da li ima smisla, naravno da ima. Imena se lako isprave, ako ti je potreban čiriličan tekst. Mnogo je lakše ispraviti imena u jednom tekstu nego kucati opet isti tekst sa transkribovanim imenima.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: rade у 8. 04. 2012. у 10.22
Транслитерација у оба смера одавно је решена. Немам сад времена да јурим све сајтове с којих се могу скинути програми за транслитерацију, али ево одавде http://oootranslit.info/ може се скинути додатак за Опен Офис који ради врло добро.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 8. 04. 2012. у 10.58
А и сам Фајерфокс има један адон који ти омогућава да маркираш текст и пребациш из једног писма у друго у року од пет секунди. Мени, нпр. помаже за преводе ових наших форумских скрипти. Како их имам на сајту, кад завршимо ћириличан превод, маркирам цео текст, кликнем на "латиница", и добијем латиничну верзију истог ПХП фајла. На тај начин имамо (имаћемо, и имали смо, још увек немамо, јер немамо још увек сопствени превод форума) потпуно идентичан текст на оба писма без по муке.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Rancher у 9. 04. 2012. у 05.47
Upravo. Otkad koristim taj dodatak (Preslovar), više mi nije potrebna srpska latinička tastatura, tako da je menjanje rasporeda uz pomoć alta i šifta mnogo lakše. U pregledaču sve kucam na ćirilici, pa ako mi zatreba latinica, samo kliknem na dugmence i gotovo! Tekst je preslovljen za tren oka. Mnogo je brže nego da koristim razne sajtove kao pre. I da dodam da je IkiPrev strava stvarčica.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Часлав Илић у 9. 04. 2012. у 09.52
Запажање да мењање распореда постаје квалитативно боље када су само два распореда у ротацији нажалост многи не начине. Само да потцртам. И још да додам ово: за оне који куцају слепо, место алт+шифт много боља пречица је алт+размак (физички као под Мек ОС-ом), јер се притиска са два палца у положају где и леже при слепом куцању.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Orlin у 9. 04. 2012. у 12.01
Може ли да се ипак избегне ручно исправљање неправилних аутоматских транслитерациjа попут коњункциjа и Схакеспеаре? Нажалост компjутер, чини ми се, jош увек не може да мисли и ништа не може да уради ако нема фиксних правила, као у наведеним случаjима.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 9. 04. 2012. у 12.33
Може ли да се ипак избегне ручно исправљање неправилних аутоматских транслитерациjа попут коњункциjа и Схакеспеаре? Нажалост компjутер, чини ми се, jош увек не може да мисли и ништа не може да уради ако нема фиксних правила, као у наведеним случаjима.
Za konjunkciju je moguće, postavljanjem izuzetaka kao pravila gde se N i J ne menjaju u Њ nego u dva posebna slova Н i Ј. Što se drugog tiče, nije moguće, sve dok se ne smisli program za transkripciju.
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Шоми у 9. 04. 2012. у 12.38
КонјуНкција, не *конјукција. Сети се нпр. енглеског junction [џанкшон], не [џакшон].
Наслов: Одг: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 9. 04. 2012. у 17.13
ааах,. сад и ти, за едно слово… :)
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: VPF у 11. 08. 2012. у 03.58
Може ли да се ипак избегне ручно исправљање неправилних аутоматских транслитерациjа попут коњункциjа и Схакеспеаре? Нажалост компjутер, чини ми се, jош увек не може да мисли и ништа не може да уради ако нема фиксних правила, као у наведеним случаjима.
Za konjunkciju je moguće, postavljanjem izuzetaka kao pravila gde se N i J ne menjaju u Њ nego u dva posebna slova Н i Ј. Što se drugog tiče, nije moguće, sve dok se ne smisli program za transkripciju.

Потцењујете и компјутере и програмере ;)

Сетите се оног Гугловог ћирилизатора који претвара осисану латиницу у ћирилицу. Нема разумног фиксног алгоритма који би дефинисао тачно кад szc треба претворити у сзц а кад у шжч. А Гугл ипак нешто успева да уради.

Може се направити програм који би на основу замашног корпуса ”научио” да је Shakespeare страно име а не српска реч, и умео да га или остави у оригиналу или преслови (не по алгоритму пресловљавања, него по знању да се у постојећим текстовима пресловљава тако и тако).

Ако тај програм још није направљен, не значи да га неће неко направити за 3-4 месеца.
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Stoundar у 11. 08. 2012. у 07.55
Google se trudi. (http://translate.google.com/#en/sr/William%20Shakespeare%0ABirmingham%0AGraham%20Greene%0ANurnberg%0AEdgar%20Rice%20Burroughs%20%0ABurroughs%20%0AGothenburg%20)
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Шоми у 11. 08. 2012. у 09.58
Google se trudi. (http://translate.google.com/#en/sr/William%20Shakespeare%0ABirmingham%0AGraham%20Greene%0ANurnberg%0AEdgar%20Rice%20Burroughs%20%0ABurroughs%20%0AGothenburg%20)

Искрена похвала на њихов рачун, заиста. [pljes]
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 11. 08. 2012. у 11.33
Sećam se da je neko na Njikipeidji pokušao da napravi program za transkripciju sa nemačkog. Meni je to izgledalo sasvim logično, jer pravila za transkripciju sa nemačkog postoje i poprilično su čvrsta, definisana i jasna. Nisam pratila situaciju, ali mi se čini da je program dosta dobro radio. Ono što mislim da je zaista nemoguće jeste da se napravi program za transkripciju sa engleskog. To što je Gugl uradio, verovatno je ubačena gotova reč, a ne pravilo za pojedinačna slova ili kombinacije slova. To se vidi po tome što je Edgar Rice Burroughs kao ređe ime, loše transkribovano, zapravo samo je transliterovano, a Burroughs je lepo transkribovano. Transkripcioni rečnik za engleski bi bilo moguće napraviti (i bio bi i te kako koristan) ali on bi morao da se pravi ručnim unošenjem reči.
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: VPF у 11. 08. 2012. у 14.01
Да, мислим да то још није свестан покушај преноса имена као имена него само последица начина на који Гуглов општи преводилац учи српски - уочио је да се у упоредним тесктовима реч Shakespeare јавља наспрам Шекспир, па то користи. Бољи корпус би покрио и Е. Р. Бароуза.

Наравно да никад неће моћи 100% савршено да научи сва опскурна имена али, да будемо фер, то не могу ни људи-преводиоци, кад постоји мода смишљања нових енглеских имена са што чуднијим спелингом. Читам некидан како неки грозни родитељи назваше дете Shithead али се чита ʃəˈθiːd - то ко не зна ситуацију сигурно не може да преслови.
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Шоми у 11. 08. 2012. у 14.08
Читам некидан како неки грозни родитељи назваше дете Shithead али се чита ʃəˈθiːd - то ко не зна ситуацију сигурно не може да преслови.

[lol]

Моја професорка немачког увек је за енглески говорила Какав је то језик? Пише Пера, а чита се Жика? :D
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Stoundar у 11. 08. 2012. у 14.35
Цитат: Al Pacino i cappuccino (http://translate.google.com/#en/sr/Al%20Pacino%0Acappuccino)
Ал Паћино
капућино
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Бруни у 11. 08. 2012. у 15.14
С тим што људи преводиоци знају да не знају, па се обавесте пре него што напишу нешто. Гугл је машина, те то не може да уради. Врло ми је занимљиво да о Гуглу говориш као о живом бићу, као да он заиста учи, а не да се ради о (опет) људском усавршавању његовог програма за превод/транскрипцију…
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Stoundar у 11. 08. 2012. у 15.44
Samo sam rekao Google se trudi, a da nisam pojasnio da li se radi o firmi ili o automatskom prevodiocu. A zašto ne bismo za mašinu rekli da uči? Ako čovjek može da nauči (manje-više tačne) transkripcije tako što čita isti tekst na raznim jezicima, može i Googleov prevodilac ako zaista koristi takvu metodologiju. Ako čovjek može da pere (na ruke), može i mašina za veš. Googleov prevodilac usavršavaju ljudi, nas usavršava evolucija, okolina, itd.
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: расејан у 23. 02. 2013. у 12.43
Може се рећи да Гугао учи онолико колико се може рећи да нешто зна. Допуњава свој фонд знања кад нађе нове упоредне текстове.

Него, код пресловљавања, како стојимо са ђ/дј? Руку на срце, има доста људи који никад нису сели за неку од старих писаћих машина са полугом мање, које нису имале ђ, а ипак пишу латиницом од 29 слова. Списак речи где аутоматско пресловљавање из дј у ђ неће радити је овде (http://ndragan.com/langsr/djilidj.html).
Наслов: Одг.: Аутоматско пресловљавање из jедног српског писма у друго
Поруку послао: Rancher у 27. 02. 2013. у 17.31
Занимљиво. :) Те речи се само додају у списак изузетака неког програма за пресловљавање и проблем решен.

Моја професорка немачког увек је за енглески говорила Какав је то језик? Пише Пера, а чита се Жика? :D
[lol] Вала, није много погрешила.