To, że zdarzenia nie są przechowywane w bieżącej bazie nie znaczy, że nie są archiwizowane.Marcin24 wrote:Czyli w sumie jak ktoś coś przeskrobie i minie tydzień to po sprawie
Raporty
Moderators: Public Relations Department, Players Department, Programming Department, Game Mechanics (RD)
- marol
- Posts: 3728
- Joined: Sun Jul 17, 2005 11:45 am
- Location: Kraków, PL
- Contact:
- CzerwonyMag
- Posts: 508
- Joined: Sun Jan 29, 2006 6:33 pm
- Location: Kraków/Cracow
w.w.g.d.w wrote:Mnie by absolutnie wystarczyło gdyby raporty były bez niezrozumiałych znaków zamiast specjalnych literek z kropkami czy zakrętasami.
To już kwestia poczty jakiej używasz. Ja kiedy słałem raporty na poczta.onet.pl było wsio ok, a gdy przerzuciłem na gmaila to się zaczęło sypać. No, ale gmail ma problem z kodowaniem polskich fontów niestety...
- w.w.g.d.w
- Posts: 1356
- Joined: Sun Oct 02, 2005 4:46 pm
- Quijo
- Posts: 1376
- Joined: Tue Jun 27, 2006 8:10 pm
- Location: K A T O W I C E ST Dept
- Contact:
- Arucard
- Posts: 666
- Joined: Sat Apr 07, 2007 10:07 pm
- Location: Poland
-
- Posts: 397
- Joined: Tue Oct 31, 2006 6:45 am
Bo wysyłane pocztą raporty są generowane przy założeniu, że tekst jest angielski (ASCII), a inne znaki to "ozdobniki". Nawet raporty "tekstowe" przedstawiają nasze "ąę..." jako encje HTML-owe. Jak ktoś ma rosyjskojęzyczną postać, to dodatkowo widzi kupę "krzaczków" zamiast cyrylicy. Widocznie za dużo zabawy z przekodowywaniem raportów z różnych stron kodowych, pochodzących od różnych postaci do jednego kodowania -- dla gracza.
- Quijo
- Posts: 1376
- Joined: Tue Jun 27, 2006 8:10 pm
- Location: K A T O W I C E ST Dept
- Contact:
- CMR
- Posts: 76
- Joined: Wed Mar 21, 2007 6:02 pm
Nawet raporty "tekstowe" przedstawiają nasze "ąę..." jako encje HTML-owe.
Tak, tylko dlaczego te encje nie są poprawne? W kodach UTF często brakuje średnika, tzn. np. aogonek raz jest & #261; kiedy indziej ą (bez średnika na końcu). Ja to sobie automatycznie konwertuję, ale wygląda mi to na błąd po stronie nadawcy.
Last edited by CMR on Tue Sep 04, 2007 10:45 pm, edited 1 time in total.
-
- Posts: 397
- Joined: Tue Oct 31, 2006 6:45 am
Dlatego, że w zwykłej wiadomości tekstowej, w czystym plain-text nie powinno być żadnych encji.CMR wrote:Tak, tylko dlaczego te encje nie są poprawne?Nawet raporty "tekstowe" przedstawiają nasze "ąę..." jako encje HTML-owe.
Średników rzeczywiście brakuje, co ciekawe nie zawsze:
ale2007-6: Widzisz jak NN mówi: " ...
Jeszcze ciekawsze, w tej samej wiadomości te same litery są zapisane raz tak, raz siak... Dialogi są faktycznie zapisane w ISO-8859-2, a teksty od gry ("Widzisz jak NN mówi", "Bierzesz 125 gram pstrąga tęczowego" itp.) - encjami. A tymczasem w nagłówku e-maila jest zadeklarowane kodowanie UTF-8. Pomieszanie z poplątaniem...2008-7: Mówisz: "...
Też konwertuję. I rozbijam e-maile na poszczególne postacie

- Maxthon
- Posts: 278
- Joined: Sun Feb 19, 2006 10:19 am
- Location: Polska
-
- Posts: 397
- Joined: Tue Oct 31, 2006 6:45 am
Nieprawda - złe dochodzą. Tyle tylko, że Ty tego nie zauważasz.Maxthon wrote:U mnie tam raporty dochodzą dobre.
Raporty są błędnie generowane, także te wysyłane w HTML. W nagłówku e-maila jest deklaracja, że treść zakodowano w UTF-8, a faktycznie jest mieszanką kodowania ISO-8859-2 (jak na stronach gry) oraz encji HTML-owych. To, że w Twoim czytniku polskie znaki wyglądają dobrze, bez krzaczków, to wyłącznie wynik przypadkowej zbieżności oraz milczącego ignorowania błędów przez czytnik. Jeśli masz postać rosyjskojęzyczną lub tureckąMaxthon wrote:Wszystko się wyświetla tak jak powinno, z polskimi znakami bez żadnych krzaczków. Mam pocztę na o2.pl a pocztę odbieram wbudowanym w Vistę programem.
Dodam jeszcze, że w ustawieniach mam przysyłanie raportów w HTML.

- marol
- Posts: 3728
- Joined: Sun Jul 17, 2005 11:45 am
- Location: Kraków, PL
- Contact:
-
- Posts: 397
- Joined: Tue Oct 31, 2006 6:45 am
Najłatwiej uzupełnić brakujące tu i ówdzie średniki w encjach. Bez względu na inne działania.
Optymalnie byłoby, żeby wiadomość była faktycznie w UTF-8, ze względu na uniwersalność rozwiązania. Załóżmy, że gracz ma dwie postacie: polską i rosyjską. Komunikaty, strony gry są wtedy w dwu różnych kodowaniach, zależnie od języka postaci, więc z obu powinny zostać sprowadzone do jednego - UTF-8.
Z grubsza wyobrażam sobie to tak: dla danej postaci wiadomo, jaki jest język, więc wiadomo, jakie jest kodowanie używane przy generowaniu stron gry dla tej postaci. (Przy czym zdarza się niestety, że w dialogu ktoś wkleja z edytora tekst z typograficznie poprawnymi znakami wielokropka, pauzy, polskich cudzysłowów. Których w ISO-8859-2 nie ma. I co im Pan zrobisz?).
Należy wstępnie raport dla pojedynczej postaci, taki jak jest robiony obecnie, przekonwertować z tego kodowania na UTF-8. Następnie encje HTML również wymienić na odpowiadające im znaki unikodowe. Wtedy dopiero, po konwersji, dopisać raport tej postaci do tworzonej wiadomości pocztowej.
Chyba nic mi nie umknęło?
Disclaimer: nie narzekam. Stwierdzam, że jest błędnie, ale nie ośmieliłbym się naciskać na PD, żeby zajęło się przerabianiem. Roboty na pewno nie brakuje
Optymalnie byłoby, żeby wiadomość była faktycznie w UTF-8, ze względu na uniwersalność rozwiązania. Załóżmy, że gracz ma dwie postacie: polską i rosyjską. Komunikaty, strony gry są wtedy w dwu różnych kodowaniach, zależnie od języka postaci, więc z obu powinny zostać sprowadzone do jednego - UTF-8.
Z grubsza wyobrażam sobie to tak: dla danej postaci wiadomo, jaki jest język, więc wiadomo, jakie jest kodowanie używane przy generowaniu stron gry dla tej postaci. (Przy czym zdarza się niestety, że w dialogu ktoś wkleja z edytora tekst z typograficznie poprawnymi znakami wielokropka, pauzy, polskich cudzysłowów. Których w ISO-8859-2 nie ma. I co im Pan zrobisz?).
Należy wstępnie raport dla pojedynczej postaci, taki jak jest robiony obecnie, przekonwertować z tego kodowania na UTF-8. Następnie encje HTML również wymienić na odpowiadające im znaki unikodowe. Wtedy dopiero, po konwersji, dopisać raport tej postaci do tworzonej wiadomości pocztowej.
Chyba nic mi nie umknęło?
Disclaimer: nie narzekam. Stwierdzam, że jest błędnie, ale nie ośmieliłbym się naciskać na PD, żeby zajęło się przerabianiem. Roboty na pewno nie brakuje

- marol
- Posts: 3728
- Joined: Sun Jul 17, 2005 11:45 am
- Location: Kraków, PL
- Contact:
Tło sytuacji jest takie, że grę tworzył Jos, później dołączył Chris, a trochę później ja. Jos jest Holendrem, Chris to Anglik. W żadnym z tych krajów nie używa się znaków innych, niż podstawowe A-Z, więc problem dla nich nie istniał do tego stopnia, że w nagłówkach stron Cantr nie było nawet deklaracji strony kodowej.
Do Cantr dodano nowe języki. Niestety nikt nie zadbał o kodowanie. Byłoby idealnie, gdyby na początku ktoś ustawił je na UTF-8. Jednak nikt tego nie zrobił, wobec czego w grze przybywało tekstów w standardach, jakie akurat przeglądarka danego gracza sobie wymyśliła. Często nawet w tym samym języku był używany więcej niż jeden standard kodowania (bardzo polski problem - ISO-8859-2 vs. Win-1250). Stąd tłumacze byli zmuszeni używać encji, które działają bezproblemowo przy każdym kodowaniu.
Obecna sytuacja jest więc taka, że w bazie jest masa tekstu o nieznanym kodowaniu - treść i tytuły notatek, nazwy budynków, wypowiedzi postaci itp. Tak więc wyświetlając stronę tak naprawdę nie mam pojęcia w jakim kodowaniu są jej fragmenty, a jeśli dochodzi do sytuacji międzystrefowych to już zamieszanie robi się niesamowite.
W związku z tym konwersja raportów do jednego standardu (UTF-8) jest na razie niemożliwa. Jedyne, co można zrobić, to poprawić encje oraz ustawiać nagłówek maila na kodowanie domyślne dla danej strefy. Nie mam jednak pojęcia jakie kodowanie stosuje się np. w Turcji, Hiszpanii czy Rosji. Nawet ustawienie kodowania w nagłówku nie rozwiąże problemu występowania tekstów napisanych wg. innej strony kodowej w treści raportu.
Do Cantr dodano nowe języki. Niestety nikt nie zadbał o kodowanie. Byłoby idealnie, gdyby na początku ktoś ustawił je na UTF-8. Jednak nikt tego nie zrobił, wobec czego w grze przybywało tekstów w standardach, jakie akurat przeglądarka danego gracza sobie wymyśliła. Często nawet w tym samym języku był używany więcej niż jeden standard kodowania (bardzo polski problem - ISO-8859-2 vs. Win-1250). Stąd tłumacze byli zmuszeni używać encji, które działają bezproblemowo przy każdym kodowaniu.
Obecna sytuacja jest więc taka, że w bazie jest masa tekstu o nieznanym kodowaniu - treść i tytuły notatek, nazwy budynków, wypowiedzi postaci itp. Tak więc wyświetlając stronę tak naprawdę nie mam pojęcia w jakim kodowaniu są jej fragmenty, a jeśli dochodzi do sytuacji międzystrefowych to już zamieszanie robi się niesamowite.
W związku z tym konwersja raportów do jednego standardu (UTF-8) jest na razie niemożliwa. Jedyne, co można zrobić, to poprawić encje oraz ustawiać nagłówek maila na kodowanie domyślne dla danej strefy. Nie mam jednak pojęcia jakie kodowanie stosuje się np. w Turcji, Hiszpanii czy Rosji. Nawet ustawienie kodowania w nagłówku nie rozwiąże problemu występowania tekstów napisanych wg. innej strony kodowej w treści raportu.
Last edited by marol on Wed Sep 05, 2007 8:42 am, edited 1 time in total.
-
- Posts: 397
- Joined: Tue Oct 31, 2006 6:45 am
Who is online
Users browsing this forum: No registered users and 1 guest