niedziela, 25 marca 2012

PHP a wersje językowe

Tworząc aplikację internetową w PHP prędzej lub później zapragniemy dodać do niej wsparcie dla wielu języków. Oczywiście tak to jak i wiele innych rzeczy można zrobić na wiele sposobów. W tym wpisie przedstawię zaledwie kilka z nich, choć myślę, że są to akurat te bardziej popularniejsze rozwiązania (Google it).
Większość metod tłumaczenia używa różnego rodzaju plików do przetrzymywania informacji o "wyglądzie" tekstu w danej wersji językowej, dlatego też znaczną część wpisy poświęcę omawianiu tych różnych "plikowych tworów".

Na początku był define
A jeśli nawet nie na początku, to jest to droga, która w ten czy inny sposób wydaje się "prosta i oczywista".
define ('Hello_World', "Witaj Świecie");

echo constant('Hello_World');
echo Hello_World;
Oczywiście przy wykorzystaniu takiej metody wszelkie definicje tekstów powinny być umieszczane w osobnym pliku dla każdej wersji językowej i w zależności od potrzeb includowawne.
Co ciekawe odwoływanie się do zdefiniowanej stałej przy użyciu constant() trwa dłużej niż bezpośrednie wywołanie:
pure:    0.5458300113678
with constant:   0.85419201850891

Metoda ta jednak nie sprawdza się w przypadku większych portali, gdzie liczba tłumaczeń przechodzi w setki czy nawet tysiące. Do tego dochodzi całkowity brak wsparcia po stronie IDE (brak auto uzupełniania i innych cudów techniki).

A gdyby tak tablicę
Co prawda tablica sama w sobie również wsparcia od IDE nie oferuje, ale daje większe możliwości segregacji wpisów (np. poprzez tworzenie wielu wymiarów).
define:   0.4133129119873
define with constant:  0.88955783843994
array:    0.35322785377502
multi array:   0.42432999610901
Poza tym jak widać po osiąganych czasach wykorzystanie tablicy okazuje się lepszą metodą niż definiowanie stałych (co zaskakujące nie jest) i dopiero wykorzystanie wielowymiarowych tablic zbliża te czasy do siebie.

.ini czyli coś prawie zapomnianego 
Dziś już prawie nikt nie używa plików .ini - bo i po co skoro są choćby XML.. Jednak ogromną zaletą plików .ini jest ich mały narzut związany z obsługą danych - nie potrzeba wieloznakowych tagów zarówno otwieranych, jak i zamykanych... nie - wystarczy klucz i znak '='. Czego rezultatem jest zaskakująca wydajność (czas liczony łącznie z parsowaniem pliku!):
define:   0.43395209312439
define with constant:  0.94658613204956
array:    0.36954712867737
multi array:   0.44773697853088
ini array:   0.42291903495789
Do tego PHP zapewnia wbudowany parser plików .ini - parse_ini_file() - tak więc stworzenie translacji na tej zasadzie jest dość proste. Poza tym pliki .ini są dość popularnym sposobem trzymania danych konfiguracyjnych dla np. bazy danych :)
Minusem wbudowanego parsera jest jednak fakt, że wygenerowana tablica może mieć maksymalnie 2 wymiary.

Profesjonalny gettext
W świecie PHP oczywiście istnieją również rozwiązania dedykowane dla lokalizacji - w tym przypadku jest to zbiór funkcji, do których generalnie odnosi się poprzez słowo "gettext". Funkcje te tak naprawdę dostępne są w wielu różnych językach programowania albo dzięki natywnym bibliotekom, albo dzięki pracy zwykłych "szarych" użytkowników. Zaletą gettexta jest jego profesjonalne podejście do zagadnienia - podczas pracy z nim dostajemy pliki z jasno opisanymi wystąpieniami każdego elementu, który mamy przetłumaczyć. No właśnie - tutaj tak naprawdę specjalny "szperacz" wyszukuje frazy, które mamy przetłumaczyć, więc możemy spokojnie pisać i testować kod nie obawiając się, że nagle dostaniemy błąd o braku danego wpisuj w tablicy czy nieistnieniu jakiejś zmiennej.

Jeśli przypadkiem poszukujecie kompilatra dla gettext to polecam zajrzeć na http://savannah.gnu.org/projects/gettext.

Natywny gettext
Wbudowany gettext wymaga zainstalowania (i uruchomienia) na serwerze rozszerzenia php_gettext.
define:    0.030115127563477
define with constant:   0.061676025390625
array:     0.021489143371582
multi array:    0.027302980422974
ini array:    0.02887487411499
Czas dla gettext (native):  0.87748694419861

Porównując szybkość jego działania jednak szybko dojdziemy do wniosku, że wcale nie jest to taki wyśniony wydajnościowo sposób implementowania lokalizacji. Cóż za to jest on na pewno przyjemniejszy podczas pisania kodu i samego procesu translacji.

gettext dla ubogich 
Może nie koniecznie dla ubogich w sensie dosłownym, a raczej dla ubogich pod względem możliwości serwera. Natywny getext ma to do siebie, że ładuje pliki z tłumaczeniami raz do pamięci i trzyma je generalnie tam aż do restartu serwera - owszem istnieją metody na obejście tego.. ale jeśli ktoś zajmuje się głównie tworzeniem strony i generalnie deweloperką to raczej będzie skłonny poświęcić trochę wydajności podczas testów na rzecz prostszego i szybszego w napisaniu kodu.Do tego dochodzi problem z aktualizacją słownika w przypadku serwerów współdzielonych - mało który admin zgodzi się na restart tylko dlatego, że nasz słowniczek zmienił tłumaczenia dla kilku elementów...
define:    0.031126976013184
define with constant:   0.062520980834961
array:     0.021286010742188
multi array:    0.02723503112793
ini array:    0.027822017669678
Czas dla gettext (native):  0.90787696838379
Czas dla gettext (custom):  1.8490700721741

Tak więc jeśli chcecie wypróbować tą nieoficjalną implementację to zapraszam na https://launchpad.net/php-gettext.

Sposoby z kosmosu
No może nie całkiem z kosmosu, bo czasami inaczej się po prostu nie da (lub wykorzystanie plikowych sposobów nie ma sensu). Ale jeśli ktoś opiera swoją wielojęzyczność elementów statycznych na bazie danych to znak, że coś się dzieje... By była jasność nie chodzi mi o elementy, które użytkownicy mogą dynamicznie dodawać do portalu, ale o tłumaczenia np. strony do logowania ^.^ Generalnie wszelkie odwołania do zewnętrznych zasobów (a baza danych takowym jest - no chyba, że mówimy o serwerze PHP znajdującym się na tej samej maszynie co baza, która to jeszcze trzyma wszystkie dane w pamięci podręcznej) to utrata cennego czasu i zasobów. Oczywiście można użyć tłumaczy online takich jak Google translate, altavista (Babel fish), czy bing translator... ale to trwa i wykorzystanie takich pereł polecałbym przenieść do JavaScriptu odpalanego przez klienta i to tylko i wyłącznie dla treści, których tłumaczenia po prostu nie jesteśmy w stanie dostarczyć.
Ciekawym sposobem podejścia do tematu jest wykorzystanie klas i zawartych w nich zmiennych jako kontenerów na tłumaczenia. Takie podejście ma ten plus, że zapewni nam auto uzupełnianie IDE i łatwość ładowania innych wersji językowych. Wadą jest wydajność, gdyż narzut związany z tworzeniem klasy powoduje, że czas konieczny na obsłużenie tego typu lokalizacji jest ok. 2 razy większy niż w przypadku deklarowania stałych za pomocą define().

Puenty brak
Cóż czasy mówią same za siebie, tak więc jeśli zależy wam na wydajności to z pewnością pomyślicie nad jakimś własnym rozwiązaniu opartym o pliki (dla leniuszków polecam zapoznać się z plikami .ini gdyż są bardzo wdzięczne pod względem tak możliwości łatwej translacji jak i użytkowania w aplikacji). Jeśli jednak już zamierzacie zagłębiać się w tajniki gettexta - technologia ta jest bardzo denerwująca (pomijając już fakt konieczności kompilacji, mergowania tłumaczeń...) choćby z tego powodu, że zwykle ciężko skłonić natywną wersję do poprawnego działania (wersja ~danilo zdecydowanie jest łatwiejsza w obsłudze) o wydajności nie mówiąc...

Chcących zaglądnąć w kod odsyłam do swojego chomika: (link)

poniedziałek, 12 marca 2012

Gdy program nie widzi sieci Hamachi

Dość częstym problemem w przypadku łączenia się z programami uruchomionymi na innych maszynach znajdujących się w sieciach Hamachi jest to, że wszelkie "auto wyszukiwarki" serwerów po prostu takowych komputerów nie uwzględniają. Innymi słowy - o ile często łączenie się po podaniu IP działa bez problemu, to już różnego rodzaju narzędzia pokazujące dostępne serwery po prostu nigdy do sieci Hamachi nie dochodzą. W rezultacie pojawia się taki problem, że np. gdy chcemy podłączyć się do serwera jakiejś gry postawionego u naszego kolegi - to niestety nie mamy takiej możliwości (chyba, że uda się nam podłączyć bezpośrednio po IP).

Dlaczego tak się dzieje? Generalnie Hamachi po instalacji dodaje swój adapter sieciowy na koniec listy połączeń zarejestrowanych w systemie. Samo to w sobie jest akurat zachowaniem pożądanym. Problem pojawia się gdy aplikacja wyszukująca serwer używa tylko i wyłącznie pierwszego połączenia z listy, czyli odnosi się do nadanego nam adresu IP związanego z tym właśnie połączeniem.

Czy da się to jakoś zmienić? Na nasze szczęście tak :)

W celu zmiany kolejności połączeń musimy udać się do naszego Panelu sterowania i w zależności od używanego widoku wybrać "Wyświetl stan sieci i zadania" lub "Centrum sieci i udostępniania".

Następnie wybieramy "Zmień ustawienia karty sieciowej" (na listwie po lewej stronie).

A teraz pora na odrobinę magii.. W otwartym oknie powinna pojawić się nam lista dostępnych połączeń sieciowych, jednak to co nas interesuje to menu, które pokazuje się dopiero po naciśnięciu klawisza [ALT]. W menu tym wybieramy "Zaawansowane" -> "Ustawienia zaawansowane...".

W nowym oknie powinniśmy ujrzeć listę połączeń, a na niej połączenie Hamachi (1). Klikamy więc na połączenie Hamachi, a następnie klikamy na strzałkę skierowaną ku górze (2) tak długo, aż to połączenie nie znajdzie się na szczycie listy. Klikamy OK i gotowe :)
Możliwe, że do uzyskania odpowiedniego efektu konieczne będzie ponowne uruchomienie komputera, ale generalnie ten zabieg powinien rozwiązać problem z niewykrywaniem serwerów :D

niedziela, 5 lutego 2012

Zabawa z Windows (Live) Movie Maker

Windows Movie Maker jest przyjaznym programikiem do tworzenia filmów nawet przez osoby całkiem zielone w tym temacie. To czym jednak zajmiemy się w tym wpisie, to nie tyle tworzenie filmów, co tworzenie konfiguracji użytej przy konwersji naszego dzieła do finalnej postaci. Ale o co chodzi? Cóż w najprostszym ujęciu chodzi o redukcję rozmiaru filmu przy minimalnej redukcji odczuwalnej jakości obrazu (odczuwalnej, gdyż ta realna cierpi bardzo).

Na sam początek kilka przykładów tego na co pozwalają opcje konfiguracji WMM. Do tego pokazu użyłem małej składanki nagrań z gry StarCraft II, a rezultaty przedstawiam poniżej w tabeli (polecam podglądanie filmików na pełnym ekranie i w "jakości" 720p [tzw. HD], by móc dokładniej ocenić jakość efektu końcowego).

Jakość kompresji filmuRozmiarPodgląd
Oryginał ~7000 kb/s81.0 MiB
6000 kb/s75.5 MiB
5000 kb/s65.7 MiB
4000 kb/s54.3 MiB
3000 kb/s42.3 MiB
2000 kb/s30.2 MiB
1000 kb/s17.9 MiB
500 kb/s11.5MB
200 kb/s7.62 MiB
100 kb/s6.31 MiB

Zauważyliście, że wszystkie te filmy dostępne są w "HD"? Cóż to wynika z tego, że YouTube uznaje za "HD" wszystkie filmy o wysokości powyżej 720 pikseli. Ponad półtorej minuty HD zajmujące 6MiB? Mniami ;]

To nad czym warto się tutaj zastanowić (a co w zasadzie jest jednym z powodów powstania tego wpisu) to to czy warto wysyłać filmy w tak wysokiej jakości (6k lub więcej kb/s) na YouTube skoro one i tak są potem kompresowane do formatu mp4. Rezultatem tej kompresji jest to, że finalny odbiorca nie widzi tak naprawdę wielkiej różnicy w jakości... Rozmyślanie to oczywiście dotyczy głównie sytuacji gdy mamy słabe łącze (niski limit uploadu) ograniczające możliwość szerzenia naszej twórczości, bo jeśli wrzucenie 1GiB filmu zajmuje nam czas np. ok. 10min  to zaprawdę taka zabawa z kompresją mija się z celem ;]

Ale przejdźmy do sedna - czyli jak sprawić by szybko (bo WMM działa bardzo szybko w porównaniu do innych programów - w tym komercyjnych kosztujących grubą kasę) zredukować rozmiar filmu?

Wybieramy z menu programu opcję "Zapisz film", a następnie "Utwórz ustawienia niestandardowe". Pojawi się nam nowe okienko zaprezentowane poniżej.
Po ukończeniu konfiguracji z tego samego menu będziemy mogli użyć zdefiniowanej konwersji do zapisu naszego filmu (użyte przeze mnie konfiguracje to właśnie te widoczne 1280x720 - xk)

To okno pozwala nam zdefiniować konfigurację tworzonego filmu - efekt działania kompresji WMM.
Opcja która ma dla nas największe znaczenie to "Szybkość transmisji bitów". Wartości powyżej 6k są na Youtubie w zasadzie uznawane za HD, choć np. efekt działania Frapsa w przypadku SC2 to powyżej 370Mb/s (ok 15MiB na sekundę filmu). Drugą ważną wartością jest Format audio, choć jego wpływ jest minimalny na rozmiar pliku (ok. 3MiB różnicy na minutę filmu pomiędzy skrajnymi ustawieniami formatu).

Użyte profile dla WMM do stworzenia filmów pokazanych w tym wpisie można znaleźć na moim chomiku: (link)

środa, 1 lutego 2012

X-COM na Steamie / DOSBox

Jeśli zdarzyłoby się, że ktoś byłby tak wielkim nieszczęśnikiem i zakupił trylogię X-COM poprzez Steam to cóż może czuć się po dwakroć.. a nawet trzykroć wykorzystany. Dlaczego?
  • Brak wersji polskiej dla oryginalnej serii X-COM
  • DOSBox w wersji 0.72 (na którym X-COM Apocalypse lubi się ciąć, wieszać i wyprawiać różne dziwne akcje)
  • Konfiguracja DOSBoxa uniemożliwiająca normalną grę
Na pierwszy punkt wiele poradzić nie mogę - mogę jedynie napisać, że istnieją tłumaczenia na język polski do wszystkich części klasycznego X-COM (przy czym do TFTD i X-COMA oficjalne wypuszczone jeszcze przez Microprose).

Zażegnanie problemowi z punktu drugiego jest w zasadzie banalne - wystarczy ściągnąć nowszą wersję DOSBoxa, zainstalować i zastąpić nią zawartość katalogu z grą.

Trzeci punkt wymaga z kolei edycji pliku konfiguracyjnego DOSBoxa (lokalizacja pliku konfiguracyjnego) i zamiany paru rzeczy:
  • X-COM Ufo Defense / UFO: Enemy Unknown
    Konfiguracja domyślnaKonfiguracja po zamianie
    [cpu]
    cycles=auto limit 8000
    [cpu]
    cycles=auto limit 100000
  • X-COM Terror From The Deep
    Konfiguracja domyślnaKonfiguracja po zamianie
    [cpu]
    cycles=auto limit 16000
    [cpu]
    cycles=auto limit 100000
  • X-COM Apocalypse
    Zmiana w przypadku X-COM Apocalypse ma inne podłoże niż te w przypadku poprzedniczek - tu problemem nie jest za wolna maszyna wirtualna, ale sposób wyświetlania obrazu. Więcej porad dotyczących X-COM Apocalypse i uruchamiania tej gry można znaleźć w innym wpisie na moim bloku: X-COM Apocalypse i Windows 7.
    Konfiguracja domyślnaKonfiguracja po zamianie
    [sdl]
    output=surface
    [sdl]
    output=overlay
Jeśli zaś nie podoba wam się sposób skalowania i chcielibyście by był bardziej zbliżony do oryginału (bardziej pikselowaty, a nie rozmyty) to polecam również zastosować tą zamianę:
Konfiguracja domyślnaKonfiguracja po zamianie
[render]
scaler=advinterp2x
[render]
scaler=normal3x