W logo prawda jest ukryta.
Są to cepy u koryta.
Kiedy gadzina ukąsi Żmudzina – od jadu Żmudzina zdycha gadzina

wtorek, 29 listopada 2016

sobota, 26 listopada 2016

Praktyczne rozwiązania

Praktyczne rozwiązanie poszukiwania wzajemnie tłumaczonych tekstów prawniczych w nieznanych językach leży w bioinformatyce. Pomysłów tam co niemiara. Można sobie poczytać tu:

Sequence alignment

piątek, 25 listopada 2016

Obliczanie funkcji charakterystycznej tekstów prawnych.

Dla ilustracji pokażę Państwu jak stwierdzić podobieństwo tekstów, które są wzajemnym tłumaczeniem nie znając języków oryginału i tłumaczenia. Dla człowieka to łatwe, dla maszyny też, tylko trzeba troszkę czasami popracować nad dobrym algorytmem.
Weźmy Prawo Zamówień Publicznych. Dlaczego tekst ustawy? Otóż teksty prawne nie są chronione prawem autorskim, więc można na nich sobie używać do woli. Gdybym na przykład wziął do obróbki jakieś dzieło uczone mogłyby powstać wątpliwości na tle Ustawy o Prawie Autorskim i Prawach Pokrewnych (chyba jakoś tak ona brzmi). Prawo autorskie we współczesnej cywilizacji to bardzo delikatna materia.
Oto oryginał

Funkcja charakterystyczna (poduchan) zakreślonego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3

A oto tłumaczenie
Poduchan tego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3

Porównajmy
29 2004 1 1 2 1 3 1 1 5 2001           97 1050 2 2 3
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3

Z takimi drobnymi różnicami algorytmy dadzą sobie radę. To, że tekst przetłumaczony jest w tym fragmencie bardziej precyzyjny (uzupełniono rok Dziennika ustaw) nie budzi zdziwienia. Wszak to wersja eksportowa. 

sobota, 19 listopada 2016

Gematria

 Rabbi Mordechaj Kraft wyjaśnia szczególną rolę języka i alfabetu hebrajskiego. W skrócie, w księdze Genesis powiedziane jest że " na początku było słowo ". Słowo było hebrajskie. Poszczególne litery hebrajskie noszą znaczenie. Pewne litery składają się z innych. Dla przykładu aleph א składa się z dwu jot י i jednej waw ו . Kabaliści twierdzą, że hebrajskie słowa (ich brzmienie i zapis) mają znaczenie podobne do wzorów chemicznych. Jest to jedyny język naturalny tego typu. Dla przykładu słowo kara אנש, czytaj "onish" (tak jak marka kosmetyków dla mężczyzn) interpretują jak odpadnięcie od najwyższej istoty.  א aleph - symbolizuje tego, którego imienia nie wolno wypowiadać bez ważnej przyczyny,נש  oznacza odpadnięcie. Swój wykład kończy wyjaśnieniem pochodzenia słów abra kadabra אברא קדברא . Ten zwrot oznacza "stworzę przez mowę". Jest taka maksyma "nomina sunt consequentia rerum". אברא קדברא oznacza coś diametralnie innego. Dobry aktor z tego rabbiego.
 

środa, 16 listopada 2016

Cywilizacja tekstu kopiowanego

Jak mawia pewien klasyk "polski system prawny to idiotyzm stosowany".

To co mamy w Polsce jest łudząco podobne do prawa. Podobieństwo to  jest podobne do podobieństwa UWM do prawdziwego uniwersytetu.

Nie ulega wątpliwości, że UWM jest ośrodkiem cywilizacji tekstu kopiowanego. Najbardziej znane przypadki kopiowania tekstu występują na Wydziale Prawa i Administracji. Pozwolą Państwo, że przypomnę odezwę Rady Wydziału WPiA UWM w sprawie nowej ordynacji wyborczej. Jest we wpisie "Mars napada" . Pod dokumentem  figuruje podpis doktor odhabilitowanej Elżbiety Żywuckiej-Kozłowskiej.  No cóż, jeśli się pisze lub podpisuje dokumenty takie jak ta uchwała, lub uchwała Senatu UWM o zwalczaniu osób "działających na szkodę uczelni", którą na porządek obrad w czerwcu 2014 wprowadził były dziekan S. Pikulski to nie pozostaje nic innego niż jako dorobek naukowy prezentować dzieła innych autorów.  Tylko trzeba uważać, aby kopiowanego dzieła nie uszkodzić. Tu p. Żywucka- Kozłowska nie dochowała należytej staranności. Argument nowego dziekana, p. Kasprzaka,  "że nie zgadza się z negatywnymi opiniami członków Komisji Habilitacyjnej, zaś kandydatka jest dobrym człowiekiem i nie zasługuje na niesprawiedliwą ocenę" zaskakuje infantylizmem. No tak "swoja baba". 
No cóż, gdy na jakiś temat wypowiada się Monika Płatek to trzeba się z taką opinią liczyć.

wtorek, 15 listopada 2016

Dobrzy ludzie pomogli

Dla dobra UWMu poświęca się nie tylko rektor, ale także niemal cała północna Polska.
Ciekawe, jak na ten przypadek spojrzy Uniwersytet Wielkiej Mistyfikacji?
https://forumakademickie.pl/fa/2016/11/habilitacja-z-prawa-na-lewo/
Wszak to ulubiony przez rektora Wydział Prawa i Administracji. 
Inkubator nauki. Z takich elementów ułożyć Uniwersytet to trzeba umieć. Prawdziwi Totumfaccy rektora. Oni chyba naprawdę wierzą, że uprawiają naukę. Najkomiczniejszy wydział wszechświata. UWM komiczny, ale jądrem tej komedii WPiA.


poniedziałek, 14 listopada 2016

Łokieć tenisisty

No i nabawiłem się łokcia tenisisty. Dlatego pisać będę rzadziej. Przez ostatnie 3 lata napisałem mniej więcej tyle samo oprogramowania co przez pozostałe 35 lat za klawiaturą komputera. Uważajcie młodzi informatycy.

niedziela, 13 listopada 2016

Zawsze w pracy

Opowiedział mi pewien człowiek związany z kościołem, że przechodząc przed ekranem w kinie, klęknął i przeżegnał się. Niektórzy są zawsze w pracy.

czwartek, 10 listopada 2016

Rozwój metody badawczej - hash Poduchy

Jak wspominałem, odkryłem metodę analizy porównawczej tekstów, pozwalającą na postawienie hipotezy, że dwa teksty w różnych językach są przekładem. Pomysł zasadza się na obliczeniu funkcji charakterystycznych obu tekstów i ich porównaniu. Czym jest funkcja charakterystyczna? To jest "wyciąg" z tekstu, zawierający jedynie cyfry. Taki "hash Poduchy" - poduchan. Na przykład taki:
436436125041543614354361435152435153436143543614354361153155.
Bierzemy oba teksty i porównujemy ich funkcje charakterystyczne.  W trywialnym przypadku oba poduchany pasują do siebie w 100 procentach. Czasami tłumaczone teksty są zlepkiem innych. Różnice mogą wynikać z również z niedokładności przekładu, lub różnic w składni. Zbieżność poduchanowa  z tych przyczyn nie będzie idealna. Trzeba będzie zastosować algorytmy stosowane w genetyce, aby szukać podciągów. Efektywność metody może wzrosnąć jeśli liczby z tekstu rozdzieli się spacjami. Otrzymamy ciągi, które będzie łatwiej dopasować przy zaistnieniu różnic. Będziemy porównywać nie cyfry, a liczby.
Zmodyfikowany poduchan wyglądać może wtedy tak:
436 436 1 2 50 415 436 1 435 436 1 435 152 435 153 436 1 435 436 1 435 436 1 153 155.



środa, 9 listopada 2016

Eureka!

Zastanawiałem się niedawno, jak stwierdzić, czy dwa teksty w różnych językach (bez znajomości tych języków) są wzajemnymi przekładami. Otóż mam dla poszukiwaczy przekładów pewną sugestię. Z badanych tekstów należy wypisywać po kolei cyfry. Dla przykładu, w przypadku tekstów prawnych, cyfry bardzo często oznaczają: numery przepisów, paragrafów i daty. Są bardzo istotne semantycznie.
Jeśli języki mają podobny szyk wyrazów w zdaniu, to metoda ta pozwala na skuteczne sprawdzenie faktu przekładu. Są języki, w których szyk zdania różni się istotnie od naszego. W języku indonezyjskim dla przykładu na początku zdania znajdują się wyrazy najważniejsze.   Tym niemniej, jeśli w zdaniach znajduje się co najwyżej jeden ciąg cyfr, to "cyfrowa" metoda poszukiwania przekładu daje też dobry rezultat.

Metoda ta pozwala na automatyczne znajdowanie tekstów w różnych językach, które mogą być przekładami. Do poszukiwania takich tekstów można używać algorytmów, stosowanych w genetyce.

poniedziałek, 7 listopada 2016

Wszystko "na p"

Dostałem polecenie zrobienia zakupów. Wszytko "na p":
1.papierosy
2.pomidory
3.pasztet
4.piwo
5.paluszki
Pięć też jest "na p".

Gdybym zapomniał to sobie obejrzę spis ze smartfona.

niedziela, 6 listopada 2016

Wkurzył się

Jeśli by ktoś z Państwa sądził, że ten film oddaje stan moich emocji, to się myli. Proszę się o mnie nie martwić. U mnie trwa radosny nastrój wyczekiwania na to, co jeszcze władze UWM-u wywiną. Troszkę mi dokucza fakt, że chciałbym kogoś pochwalić, bo to bardziej podnosi na duchu. Kilku z opisywanych ludzi ma oczywiście też swoje zalety. Poza tym, pochwała na łamach p.o.Duchy mogłaby ściągnąć na osoby chwalone anatemę. No cóż, uprawiam zjadliwą satyrę i to nie mieści się w gatunku.

Jednak nie mogę się powstrzymać od pochwały Wydziału Weterynarii, a szczególnie ich talentów dydaktycznych. Absolwenci są bardzo dobrze przygotowani. Moje psy zawdzięczają im długie życie. Nie raz dzięki nim wyszły spod łopaty. W ogóle jako ssak domagam się równouprawnienia ze zwierzętami i prawa wyboru formy opieki zdrowotnej. NFZ lub weterynaryjnej.


sobota, 5 listopada 2016

Studenci UJ się bawią

"...Kiedy mordę zaś otworzy, prostym chamem ze wsi jest. ..."
Bywają i tacy dziekani i rektorzy. Wcale nierzadko.  Nie tylko na UJ. 


A tu rosyjski oryginał:


czwartek, 3 listopada 2016

Spodobało się

Zadziwiające rzeczy dzieją się z twórczością Piotra i Mateusza Obarków. UWM-owi "nie podoba" się jego logo (autor Piotr Obarek) dlatego robią logo bardzo do niego podobne, a Newsweekowi spodobał się plakat Mateusza Obarka, dlatego lisie czasopismo przywłaszczyło sobie jego pomysł. Mateusz pomstuje:


Ten malutki ludzik u dołu ma na plecach logo firmy Mateusza Obarka "Gravite". Robot - zabójca oznaczony jest logiem lisiego tygodnika - Newsweek. Newsweek - niby taki europejski a ma kłopoty z rozumieniem cudzej własności. Może po prostu to mocno poperfumowana dzicz?