wtorek, 29 listopada 2016
Zdolniejsza od Steinhausa
Hugo Steinhaus nie załapał się do wojska, bo jego kapral stwierdził, że matematyka nie da się nauczyć strzelać.
sobota, 26 listopada 2016
Praktyczne rozwiązania
Praktyczne rozwiązanie poszukiwania wzajemnie tłumaczonych tekstów prawniczych w nieznanych językach leży w bioinformatyce. Pomysłów tam co niemiara. Można sobie poczytać tu:
Sequence alignment
Sequence alignment
piątek, 25 listopada 2016
Obliczanie funkcji charakterystycznej tekstów prawnych.
Dla ilustracji pokażę Państwu jak stwierdzić podobieństwo tekstów, które są wzajemnym tłumaczeniem nie znając języków oryginału i tłumaczenia. Dla człowieka to łatwe, dla maszyny też, tylko trzeba troszkę czasami popracować nad dobrym algorytmem.
Weźmy Prawo Zamówień Publicznych. Dlaczego tekst ustawy? Otóż teksty prawne nie są chronione prawem autorskim, więc można na nich sobie używać do woli. Gdybym na przykład wziął do obróbki jakieś dzieło uczone mogłyby powstać wątpliwości na tle Ustawy o Prawie Autorskim i Prawach Pokrewnych (chyba jakoś tak ona brzmi). Prawo autorskie we współczesnej cywilizacji to bardzo delikatna materia.
Oto oryginał
Funkcja charakterystyczna (poduchan) zakreślonego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3
A oto tłumaczenie
Poduchan tego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3
Porównajmy
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3
Z takimi drobnymi różnicami algorytmy dadzą sobie radę. To, że tekst przetłumaczony jest w tym fragmencie bardziej precyzyjny (uzupełniono rok Dziennika ustaw) nie budzi zdziwienia. Wszak to wersja eksportowa.
Weźmy Prawo Zamówień Publicznych. Dlaczego tekst ustawy? Otóż teksty prawne nie są chronione prawem autorskim, więc można na nich sobie używać do woli. Gdybym na przykład wziął do obróbki jakieś dzieło uczone mogłyby powstać wątpliwości na tle Ustawy o Prawie Autorskim i Prawach Pokrewnych (chyba jakoś tak ona brzmi). Prawo autorskie we współczesnej cywilizacji to bardzo delikatna materia.
Oto oryginał
Funkcja charakterystyczna (poduchan) zakreślonego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3
A oto tłumaczenie
Poduchan tego tekstu wynosi
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3
Porównajmy
29 2004 1 1 2 1 3 1 1 5 2001 97 1050 2 2 3
29 2004 1 1 2 1 3 1 1 5 2001 2002 97 1050 2 2 3
Z takimi drobnymi różnicami algorytmy dadzą sobie radę. To, że tekst przetłumaczony jest w tym fragmencie bardziej precyzyjny (uzupełniono rok Dziennika ustaw) nie budzi zdziwienia. Wszak to wersja eksportowa.
sobota, 19 listopada 2016
Gematria
Rabbi Mordechaj Kraft wyjaśnia szczególną rolę języka i alfabetu hebrajskiego. W skrócie, w księdze Genesis powiedziane jest że " na początku było słowo ". Słowo było hebrajskie. Poszczególne litery hebrajskie noszą znaczenie. Pewne litery składają się z innych. Dla przykładu aleph א składa się z dwu jot י i jednej waw ו . Kabaliści twierdzą, że hebrajskie słowa (ich brzmienie i zapis) mają znaczenie podobne do wzorów chemicznych. Jest to jedyny język naturalny tego typu. Dla przykładu słowo kara אנש, czytaj "onish" (tak jak marka kosmetyków dla mężczyzn) interpretują jak odpadnięcie od najwyższej istoty. א aleph - symbolizuje tego, którego imienia nie wolno wypowiadać bez ważnej przyczyny,נש oznacza odpadnięcie. Swój wykład kończy wyjaśnieniem pochodzenia słów abra kadabra אברא קדברא . Ten zwrot oznacza "stworzę przez mowę". Jest taka maksyma "nomina sunt consequentia rerum". אברא קדברא oznacza coś diametralnie innego. Dobry aktor z tego rabbiego.
środa, 16 listopada 2016
Cywilizacja tekstu kopiowanego
Jak mawia pewien klasyk "polski system prawny to idiotyzm stosowany".
To co mamy w Polsce jest łudząco podobne do prawa. Podobieństwo to jest podobne do podobieństwa UWM do prawdziwego uniwersytetu.
Nie ulega wątpliwości, że UWM jest ośrodkiem cywilizacji tekstu kopiowanego. Najbardziej znane przypadki kopiowania tekstu występują na Wydziale Prawa i Administracji. Pozwolą Państwo, że przypomnę odezwę Rady Wydziału WPiA UWM w sprawie nowej ordynacji wyborczej. Jest we wpisie "Mars napada" . Pod dokumentem figuruje podpis doktor odhabilitowanej Elżbiety Żywuckiej-Kozłowskiej. No cóż, jeśli się pisze lub podpisuje dokumenty takie jak ta uchwała, lub uchwała Senatu UWM o zwalczaniu osób "działających na szkodę uczelni", którą na porządek obrad w czerwcu 2014 wprowadził były dziekan S. Pikulski to nie pozostaje nic innego niż jako dorobek naukowy prezentować dzieła innych autorów. Tylko trzeba uważać, aby kopiowanego dzieła nie uszkodzić. Tu p. Żywucka- Kozłowska nie dochowała należytej staranności. Argument nowego dziekana, p. Kasprzaka, "że nie zgadza się z negatywnymi opiniami członków Komisji Habilitacyjnej, zaś kandydatka jest dobrym człowiekiem i nie zasługuje na niesprawiedliwą ocenę" zaskakuje infantylizmem. No tak "swoja baba".
No cóż, gdy na jakiś temat wypowiada się Monika Płatek to trzeba się z taką opinią liczyć.
To co mamy w Polsce jest łudząco podobne do prawa. Podobieństwo to jest podobne do podobieństwa UWM do prawdziwego uniwersytetu.
Nie ulega wątpliwości, że UWM jest ośrodkiem cywilizacji tekstu kopiowanego. Najbardziej znane przypadki kopiowania tekstu występują na Wydziale Prawa i Administracji. Pozwolą Państwo, że przypomnę odezwę Rady Wydziału WPiA UWM w sprawie nowej ordynacji wyborczej. Jest we wpisie "Mars napada" . Pod dokumentem figuruje podpis doktor odhabilitowanej Elżbiety Żywuckiej-Kozłowskiej. No cóż, jeśli się pisze lub podpisuje dokumenty takie jak ta uchwała, lub uchwała Senatu UWM o zwalczaniu osób "działających na szkodę uczelni", którą na porządek obrad w czerwcu 2014 wprowadził były dziekan S. Pikulski to nie pozostaje nic innego niż jako dorobek naukowy prezentować dzieła innych autorów. Tylko trzeba uważać, aby kopiowanego dzieła nie uszkodzić. Tu p. Żywucka- Kozłowska nie dochowała należytej staranności. Argument nowego dziekana, p. Kasprzaka, "że nie zgadza się z negatywnymi opiniami członków Komisji Habilitacyjnej, zaś kandydatka jest dobrym człowiekiem i nie zasługuje na niesprawiedliwą ocenę" zaskakuje infantylizmem. No tak "swoja baba".
No cóż, gdy na jakiś temat wypowiada się Monika Płatek to trzeba się z taką opinią liczyć.
wtorek, 15 listopada 2016
Dobrzy ludzie pomogli
Dla dobra UWMu poświęca się nie tylko rektor, ale także niemal cała północna Polska.
Ciekawe, jak na ten przypadek spojrzy Uniwersytet Wielkiej Mistyfikacji?
https://forumakademickie.pl/fa/2016/11/habilitacja-z-prawa-na-lewo/
Wszak to ulubiony przez rektora Wydział Prawa i Administracji.
Inkubator nauki. Z takich elementów ułożyć Uniwersytet to trzeba umieć. Prawdziwi Totumfaccy rektora. Oni chyba naprawdę wierzą, że uprawiają naukę. Najkomiczniejszy wydział wszechświata. UWM komiczny, ale jądrem tej komedii WPiA.
Ciekawe, jak na ten przypadek spojrzy Uniwersytet Wielkiej Mistyfikacji?
https://forumakademickie.pl/fa/2016/11/habilitacja-z-prawa-na-lewo/
Wszak to ulubiony przez rektora Wydział Prawa i Administracji.
Inkubator nauki. Z takich elementów ułożyć Uniwersytet to trzeba umieć. Prawdziwi Totumfaccy rektora. Oni chyba naprawdę wierzą, że uprawiają naukę. Najkomiczniejszy wydział wszechświata. UWM komiczny, ale jądrem tej komedii WPiA.
poniedziałek, 14 listopada 2016
Łokieć tenisisty
No i nabawiłem się łokcia tenisisty. Dlatego pisać będę rzadziej. Przez ostatnie 3 lata napisałem mniej więcej tyle samo oprogramowania co przez pozostałe 35 lat za klawiaturą komputera. Uważajcie młodzi informatycy.
niedziela, 13 listopada 2016
Zawsze w pracy
Opowiedział mi pewien człowiek związany z kościołem, że przechodząc przed ekranem w kinie, klęknął i przeżegnał się. Niektórzy są zawsze w pracy.
sobota, 12 listopada 2016
piątek, 11 listopada 2016
czwartek, 10 listopada 2016
Rozwój metody badawczej - hash Poduchy
Jak wspominałem, odkryłem metodę analizy porównawczej tekstów, pozwalającą na postawienie hipotezy, że dwa teksty w różnych językach są przekładem. Pomysł zasadza się na obliczeniu funkcji charakterystycznych obu tekstów i ich porównaniu. Czym jest funkcja charakterystyczna? To jest "wyciąg" z tekstu, zawierający jedynie cyfry. Taki "hash Poduchy" - poduchan. Na przykład taki:
436436125041543614354361435152435153436143543614354361153155.
Bierzemy oba teksty i porównujemy ich funkcje charakterystyczne. W trywialnym przypadku oba poduchany pasują do siebie w 100 procentach. Czasami tłumaczone teksty są zlepkiem innych. Różnice mogą wynikać z również z niedokładności przekładu, lub różnic w składni. Zbieżność poduchanowa z tych przyczyn nie będzie idealna. Trzeba będzie zastosować algorytmy stosowane w genetyce, aby szukać podciągów. Efektywność metody może wzrosnąć jeśli liczby z tekstu rozdzieli się spacjami. Otrzymamy ciągi, które będzie łatwiej dopasować przy zaistnieniu różnic. Będziemy porównywać nie cyfry, a liczby.
Zmodyfikowany poduchan wyglądać może wtedy tak:
436 436 1 2 50 415 436 1 435 436 1 435 152 435 153 436 1 435 436 1 435 436 1 153 155.
436436125041543614354361435152435153436143543614354361153155.
Bierzemy oba teksty i porównujemy ich funkcje charakterystyczne. W trywialnym przypadku oba poduchany pasują do siebie w 100 procentach. Czasami tłumaczone teksty są zlepkiem innych. Różnice mogą wynikać z również z niedokładności przekładu, lub różnic w składni. Zbieżność poduchanowa z tych przyczyn nie będzie idealna. Trzeba będzie zastosować algorytmy stosowane w genetyce, aby szukać podciągów. Efektywność metody może wzrosnąć jeśli liczby z tekstu rozdzieli się spacjami. Otrzymamy ciągi, które będzie łatwiej dopasować przy zaistnieniu różnic. Będziemy porównywać nie cyfry, a liczby.
Zmodyfikowany poduchan wyglądać może wtedy tak:
436 436 1 2 50 415 436 1 435 436 1 435 152 435 153 436 1 435 436 1 435 436 1 153 155.
środa, 9 listopada 2016
Eureka!
Zastanawiałem się niedawno, jak stwierdzić, czy dwa teksty w różnych językach (bez znajomości tych języków) są wzajemnymi przekładami. Otóż mam dla poszukiwaczy przekładów pewną sugestię. Z badanych tekstów należy wypisywać po kolei cyfry. Dla przykładu, w przypadku tekstów prawnych, cyfry bardzo często oznaczają: numery przepisów, paragrafów i daty. Są bardzo istotne semantycznie.
Jeśli języki mają podobny szyk wyrazów w zdaniu, to metoda ta pozwala na skuteczne sprawdzenie faktu przekładu. Są języki, w których szyk zdania różni się istotnie od naszego. W języku indonezyjskim dla przykładu na początku zdania znajdują się wyrazy najważniejsze. Tym niemniej, jeśli w zdaniach znajduje się co najwyżej jeden ciąg cyfr, to "cyfrowa" metoda poszukiwania przekładu daje też dobry rezultat.
Metoda ta pozwala na automatyczne znajdowanie tekstów w różnych językach, które mogą być przekładami. Do poszukiwania takich tekstów można używać algorytmów, stosowanych w genetyce.
Jeśli języki mają podobny szyk wyrazów w zdaniu, to metoda ta pozwala na skuteczne sprawdzenie faktu przekładu. Są języki, w których szyk zdania różni się istotnie od naszego. W języku indonezyjskim dla przykładu na początku zdania znajdują się wyrazy najważniejsze. Tym niemniej, jeśli w zdaniach znajduje się co najwyżej jeden ciąg cyfr, to "cyfrowa" metoda poszukiwania przekładu daje też dobry rezultat.
Metoda ta pozwala na automatyczne znajdowanie tekstów w różnych językach, które mogą być przekładami. Do poszukiwania takich tekstów można używać algorytmów, stosowanych w genetyce.
poniedziałek, 7 listopada 2016
Wszystko "na p"
Dostałem polecenie zrobienia zakupów. Wszytko "na p":
1.papierosy
2.pomidory
3.pasztet
4.piwo
5.paluszki
Pięć też jest "na p".
Gdybym zapomniał to sobie obejrzę spis ze smartfona.
1.papierosy
2.pomidory
3.pasztet
4.piwo
5.paluszki
Pięć też jest "na p".
Gdybym zapomniał to sobie obejrzę spis ze smartfona.
niedziela, 6 listopada 2016
Wkurzył się
Jeśli by ktoś z Państwa sądził, że ten film oddaje stan moich emocji, to się myli. Proszę się o mnie nie martwić. U mnie trwa radosny nastrój wyczekiwania na to, co jeszcze władze UWM-u wywiną. Troszkę mi dokucza fakt, że chciałbym kogoś pochwalić, bo to bardziej podnosi na duchu. Kilku z opisywanych ludzi ma oczywiście też swoje zalety. Poza tym, pochwała na łamach p.o.Duchy mogłaby ściągnąć na osoby chwalone anatemę. No cóż, uprawiam zjadliwą satyrę i to nie mieści się w gatunku.
Jednak nie mogę się powstrzymać od pochwały Wydziału Weterynarii, a szczególnie ich talentów dydaktycznych. Absolwenci są bardzo dobrze przygotowani. Moje psy zawdzięczają im długie życie. Nie raz dzięki nim wyszły spod łopaty. W ogóle jako ssak domagam się równouprawnienia ze zwierzętami i prawa wyboru formy opieki zdrowotnej. NFZ lub weterynaryjnej.
Jednak nie mogę się powstrzymać od pochwały Wydziału Weterynarii, a szczególnie ich talentów dydaktycznych. Absolwenci są bardzo dobrze przygotowani. Moje psy zawdzięczają im długie życie. Nie raz dzięki nim wyszły spod łopaty. W ogóle jako ssak domagam się równouprawnienia ze zwierzętami i prawa wyboru formy opieki zdrowotnej. NFZ lub weterynaryjnej.
sobota, 5 listopada 2016
Studenci UJ się bawią
"...Kiedy mordę zaś otworzy, prostym chamem ze wsi jest. ..."
Bywają i tacy dziekani i rektorzy. Wcale nierzadko. Nie tylko na UJ.
A tu rosyjski oryginał:
Bywają i tacy dziekani i rektorzy. Wcale nierzadko. Nie tylko na UJ.
A tu rosyjski oryginał:
czwartek, 3 listopada 2016
Spodobało się
Zadziwiające rzeczy dzieją się z twórczością Piotra i Mateusza Obarków. UWM-owi "nie podoba" się jego logo (autor Piotr Obarek) dlatego robią logo bardzo do niego podobne, a Newsweekowi spodobał się plakat Mateusza Obarka, dlatego lisie czasopismo przywłaszczyło sobie jego pomysł. Mateusz pomstuje:
Ten malutki ludzik u dołu ma na plecach logo firmy Mateusza Obarka "Gravite". Robot - zabójca oznaczony jest logiem lisiego tygodnika - Newsweek. Newsweek - niby taki europejski a ma kłopoty z rozumieniem cudzej własności. Może po prostu to mocno poperfumowana dzicz?
Ten malutki ludzik u dołu ma na plecach logo firmy Mateusza Obarka "Gravite". Robot - zabójca oznaczony jest logiem lisiego tygodnika - Newsweek. Newsweek - niby taki europejski a ma kłopoty z rozumieniem cudzej własności. Może po prostu to mocno poperfumowana dzicz?
Subskrybuj:
Posty (Atom)