Vojna Enciklopedija:Софтвер МедијаВики

Izvor: Vojna Enciklopedija
Ово је најновија верзија ове странице; нема одобрених измена.
Пређи на навигацију Пређи на претрагу

Луа еррор: Цаннот цреате процесс: проц_опен(/дев/нулл): фаилед то опен стреам: Оператион нот пермиттед

Ово је место предвиђено за координацију између сарадника у раду проширења и имплементације Викимедија софтвера за српски језик, као и за коментаре осталих заинтересованих посетилаца :-)

Имплементација ЛАТ-ЋИР-Е-ИЈЕ

Стање

  1. Изворни код се води (и снима у базу података) ћирилицом (до даљњег)
  2. Конверзија ћирилице у латиницу и обратно је аутоматска (при клику на одговарајућу групу)
  3. Још не постоји (или ми је измакла) синтакса за одвајање речи које не треба да се конвертују (оргинална имена и називи, стручни изрази и слично)
    1. Постоји. Између две заграде: ((не пресловљавај)).
Нажалост то фукционише само делимично ... проблем настаје ако између дуплих заграда постоји нека веза (не конвертира се само део до везе) :-(, значи потребна је коректура алгоритма (РегЕxп)
  • Да, Женгжу се жалио на то да не зна добро регуларне изразе. Мислим да имаш његову адресу. Можда би било добро да нас тројица размењујемо мејлове тим поводом, а овде да приказујемо шта се дешава?
  1. Подршка за екавски/ијекавски фукнционише. У употреби је синтакса ((млеко; млијеко)).
    1. Грешка при сл. сценарију: Кликом на линк из стране са ијекавском варијантом се не долази на страну са ијекавском него екавском (стандард) варијантом. Значи, потребна је коректура/имплементација праћења активне варијанте преко "више слојева позива", тј. глобално снимање и "ношење" актуелне варијанте.
  2. Број варијанти је 5 (!) Поред "Српски-Ћир-Е", "Српски-Ћир-Ије", "Српски-Лат-Е" и "Српски-Лат-Ије", постоји и варијанта "Српски" што је непотребно. Коначно, једна варијанта мора да буде водећа (стандардна). Да ли ће водећу варијанту моћи сваки корисник себи да конфигурише или ће бити "централно" одређена (Српски-Ћир-Е ?) - видјећемо.
  3. Укупан број варијанти треба да је 4. Стандардна варијанта (или корисничка или глобална) би требало да се крије иза линка "чланак" (артицле), док би остала три требало смјестити скроз десно.
  4. Имамо још пар ситних грешкица у називима група и сл.
  5. Постоји пар нејасноћа са конверзионим табелама, као на примјер ...

(ЛангуагеСр.пхп, арраy $мТоЛатин) садржи следеће:

'дж'=> 'џ' , 'лј'=> 'љ' , 'нј'=> 'њ' , 'D!ж'=> 'Џ' , 'D!Ж'=> 'Џ' , 'L!ј'=> 'Љ' , 'L!Ј'=> 'Љ' , 'Нј'=>'Њ' , 'НЈ'=>'Њ' ,

... наиме дждж није ћирилица и самим тим је тај пар непотребан (или сам ја нешто побркао).

  • Па само утолико што је то спремање за следећу фазу. Другим речима, од тренутка имплементације софтвера, технички ће бити могуће писати мешаним сорсом. Ипак, наша језичка политика у тој фази (док год немамо могућност контроле уписа) остаје да се може писати само ћирилицом и екавски (уз могуће означавање екавско-ијекавских варијаната, свакако) све док не будемо овладали уписом у базу; што ће се догодити у неко догледно време. Фактички, такво стање је проузроковано тиме што би Женгжуу требало знатно више времена да одмах имплементира све.

Постоје и други примјери са сличном тематиком.

Следећи кораци

  1. Кориговати алгоритам (вероватно РегЕxп) за одвајање ријечи без конверзије
  2. Израда упутства (документације)

Средства за рад

  • Ажурирање и праћење историје грешака
  1. Бугзилла
  • Тест-софтвер.
  1. Ја имам добра искуства са ПуреТест-ом.
  2. Можда ускоро долази у обзир и Солеx.

Дискусија

Па овако... идеја је одлична и лепо је што се неко томе посвећује. Али има ту проблема у концепту. Прво, није довољно да може да се чита, па и да се пише и ћирилицом и латиницом. Ту је основни проблем што неки људи једноставно немају ћирилицу на компјутеру, па им треба текст латиницом и кад уређују чланак који је неко написао ћирилицом. Значи, треба радити тоталну конверзију или у ћирилицу или у латиницу кад се чланак сними, па конвертовати по потреби за оне који користе друго.

Друго, проблем је кад се дозволи писање текста који већина људи не види, значи ((бело; бијело)). Ту ја могу да ставим иза ; и неку непристојну реч или политичку паролу, и ако на некој страници урадим пуно ваљаних промена и једну такву, неће то нико ни ухватити. Значи да могу људи да пишу у енциклопедију ствари које нећемо ни приметити.

Дакле, како би требало да ради:

(ј), (иј) испред е, (е/и) у средини речи
Н(ј)емачка --> Немачка, Њемачка
б(иј)ело --> бело, бијело
б(е/и)л(ј)езница -> бележница, биљежница
љ, њ, џ --> љ, њ, џ без милости, синтакса за раздвајање ће требати јако ретко и већ постоји у хтмл
мишљење --> мишљење
над‌живети --> наџивети
Кардел‌јево -->Кардељево, како је писало некад на железничкој станици у Плочама.
<ноцц>без конверзије</ноцц>
...да не измишљамо џаба нову синтаксу
Мало сам испао из штоса гледе овог, али да наведем неке ствари: Екавско-ијекавски може бити написано и мл((е;ије))ко. Проблем са Немачком је што си кренуо латиницом, а ниси видео како то изгледа ћирилицом :) (може и бележница/биљежница као други пример :) ). Формално је напорно се зајебавати са неколико сета правила, а и ко ти гарантује да то није била намерна заграда? Зато су две заграде. Што се тиче изостављања конверзије, ту је ствар у томе што сам се трудио да се користе само они знакови који постоје на српским тастатурама. Само у посебним случајевима знакови <> постоје (ако је схифт краће и поред има тај знак), док углавном не постоје. Даље, "џ" се чешће појављује од "џ". Хм. Користим Фајерфокс и не разумем шта си написао код наџивети и Кардељева? Успут, да кажем да, што се тиче синтаксе, принцип је сасвим прихватљив. Кинези користе знатно сложенију синтаксу за разлике. I није ХТМЛ. Али, можемо детаљно о сваком предлогу/принципу...

Ево по тачкама, да се лепше види:

  • Не знам колико се често употребљава раздвојено џ, али мени стварно не изгледа да чешће него спојено. Тешко ми се и сетити примера осим наџивети, а ових других колико хоћеш, од џезве и џанарике до враџбине. Ал ко што рекох, немам податак.
  • Оно ‌ је хтмл код за раздвајање знакова у језицима где несто знаце спојени. У тексту се не види, али раздваја слова: а‌б. Јесте да је ружно али ретко треба.
  • Може лако да се конвертује и Н(Ј)емачка у Немачка и Њемачка па то није неки велики проблем.
  • За случај биљежнице сам додао горе предлог.