Vojna Enciklopedija:Софтвер МедијаВики
Луа еррор: Цаннот цреате процесс: проц_опен(/дев/нулл): фаилед то опен стреам: Оператион нот пермиттед
|
Ово је место предвиђено за координацију између сарадника у раду проширења и имплементације Викимедија софтвера за српски језик, као и за коментаре осталих заинтересованих посетилаца :-) |
Имплементација ЛАТ-ЋИР-Е-ИЈЕ
Стање
- Изворни код се води (и снима у базу података) ћирилицом (до даљњег)
- Конверзија ћирилице у латиницу и обратно је аутоматска (при клику на одговарајућу групу)
- Још не постоји (или ми је измакла) синтакса за одвајање речи које не треба да се конвертују (оргинална имена и називи, стручни изрази и слично)
- Постоји. Између две заграде: ((не пресловљавај)).
- Нажалост то фукционише само делимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само део до везе) :-(, значи потребна је коректура алгоритма (РегЕxп)
- Да, Женгжу се жалио на то да не зна добро регуларне изразе. Мислим да имаш његову адресу. Можда би било добро да нас тројица размењујемо мејлове тим поводом, а овде да приказујемо шта се дешава?
- Нажалост то фукционише само делимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само део до везе) :-(, значи потребна је коректура алгоритма (РегЕxп)
- Подршка за екавски/ијекавски фукнционише. У употреби је синтакса ((млеко; млијеко)).
- Грешка при сл. сценарију: Кликом на линк из стране са ијекавском варијантом се не долази на страну са ијекавском него екавском (стандард) варијантом. Значи, потребна је коректура/имплементација праћења активне варијанте преко "више слојева позива", тј. глобално снимање и "ношење" актуелне варијанте.
- Број варијанти је 5 (!) Поред "Српски-Ћир-Е", "Српски-Ћир-Ије", "Српски-Лат-Е" и "Српски-Лат-Ије", постоји и варијанта "Српски" што је непотребно. Коначно, једна варијанта мора да буде водећа (стандардна). Да ли ће водећу варијанту моћи сваки корисник себи да конфигурише или ће бити "централно" одређена (Српски-Ћир-Е ?) - видјећемо.
- Укупан број варијанти треба да је 4. Стандардна варијанта (или корисничка или глобална) би требало да се крије иза линка "чланак" (артицле), док би остала три требало смјестити скроз десно.
- Имамо још пар ситних грешкица у називима група и сл.
- Постоји пар нејасноћа са конверзионим табелама, као на примјер ...
(ЛангуагеСр.пхп, арраy $мТоЛатин) садржи следеће:
'дж'=> 'џ' , 'лј'=> 'љ' , 'нј'=> 'њ' , 'D!ж'=> 'Џ' , 'D!Ж'=> 'Џ' , 'L!ј'=> 'Љ' , 'L!Ј'=> 'Љ' , 'Нј'=>'Њ' , 'НЈ'=>'Њ' ,
... наиме дждж није ћирилица и самим тим је тај пар непотребан (или сам ја нешто побркао).
- Па само утолико што је то спремање за следећу фазу. Другим речима, од тренутка имплементације софтвера, технички ће бити могуће писати мешаним сорсом. Ипак, наша језичка политика у тој фази (док год немамо могућност контроле уписа) остаје да се може писати само ћирилицом и екавски (уз могуће означавање екавско-ијекавских варијаната, свакако) све док не будемо овладали уписом у базу; што ће се догодити у неко догледно време. Фактички, такво стање је проузроковано тиме што би Женгжуу требало знатно више времена да одмах имплементира све.
Постоје и други примјери са сличном тематиком.
Следећи кораци
- Кориговати алгоритам (вероватно РегЕxп) за одвајање ријечи без конверзије
- Израда упутства (документације)
Средства за рад
- Ажурирање и праћење историје грешака
- Тест-софтвер.
Дискусија
Па овако... идеја је одлична и лепо је што се неко томе посвећује. Али има ту проблема у концепту. Прво, није довољно да може да се чита, па и да се пише и ћирилицом и латиницом. Ту је основни проблем што неки људи једноставно немају ћирилицу на компјутеру, па им треба текст латиницом и кад уређују чланак који је неко написао ћирилицом. Значи, треба радити тоталну конверзију или у ћирилицу или у латиницу кад се чланак сними, па конвертовати по потреби за оне који користе друго.
Друго, проблем је кад се дозволи писање текста који већина људи не види, значи ((бело; бијело)). Ту ја могу да ставим иза ; и неку непристојну реч или политичку паролу, и ако на некој страници урадим пуно ваљаних промена и једну такву, неће то нико ни ухватити. Значи да могу људи да пишу у енциклопедију ствари које нећемо ни приметити.
Дакле, како би требало да ради:
- (ј), (иј) испред е, (е/и) у средини речи
- Н(ј)емачка --> Немачка, Њемачка
- б(иј)ело --> бело, бијело
- б(е/и)л(ј)езница -> бележница, биљежница
- љ, њ, џ --> љ, њ, џ без милости, синтакса за раздвајање ће требати јако ретко и већ постоји у хтмл
- мишљење --> мишљење
- надживети --> наџивети
- Карделјево -->Кардељево, како је писало некад на железничкој станици у Плочама.
- <ноцц>без конверзије</ноцц>
- ...да не измишљамо џаба нову синтаксу
- Мало сам испао из штоса гледе овог, али да наведем неке ствари: Екавско-ијекавски може бити написано и мл((е;ије))ко. Проблем са Немачком је што си кренуо латиницом, а ниси видео како то изгледа ћирилицом :) (може и бележница/биљежница као други пример :) ). Формално је напорно се зајебавати са неколико сета правила, а и ко ти гарантује да то није била намерна заграда? Зато су две заграде. Што се тиче изостављања конверзије, ту је ствар у томе што сам се трудио да се користе само они знакови који постоје на српским тастатурама. Само у посебним случајевима знакови <> постоје (ако је схифт краће и поред има тај знак), док углавном не постоје. Даље, "џ" се чешће појављује од "џ". Хм. Користим Фајерфокс и не разумем шта си написао код наџивети и Кардељева? Успут, да кажем да, што се тиче синтаксе, принцип је сасвим прихватљив. Кинези користе знатно сложенију синтаксу за разлике. I није ХТМЛ. Али, можемо детаљно о сваком предлогу/принципу...
Ево по тачкама, да се лепше види:
- Не знам колико се често употребљава раздвојено џ, али мени стварно не изгледа да чешће него спојено. Тешко ми се и сетити примера осим наџивети, а ових других колико хоћеш, од џезве и џанарике до враџбине. Ал ко што рекох, немам податак.
- Оно је хтмл код за раздвајање знакова у језицима где несто знаце спојени. У тексту се не види, али раздваја слова: аб. Јесте да је ружно али ретко треба.
- Може лако да се конвертује и Н(Ј)емачка у Немачка и Њемачка па то није неки велики проблем.
- За случај биљежнице сам додао горе предлог.