Jako programista, stoczyłem ponad miesiąc na polu walki pomiędzy standardami, a wdrożeniami. Chodzi mi oczywiście o technologiczne podłoże 10przykazan. Z przykrością stwierdzam, że żaden z agregowanych przez nas serwisów blogowych nie generuje poprawnego kanału RSS.

Piszę to w nawiązaniu do analizy polskiej blogosfery, napisanej przez Riddle'a, a do której nawiązał też Maciej Łebkowski. Poziom techniczny naszego kawałka Internetu przypomina bardziej chałupy zbudowane z powiązanych drutem łodyg bambusa, niż domy. Niby wszystko działa, niby wszystko mamy to samo, ale wystarczy zajrzeć pod śliczny papierek z kokardką, żeby okazało się, że pod spodem mamy pęk drutów posklejanych taśmą klejącą.

Drodzy panowie administratorzy serwisów — kanał RSS jest aplikacją XML i wymaga kodowania encji w standardzie XML. Tak, oznacza to dokładnie tyle, że ampersand i znak mniejszości powinny być zamienione na ich odpowiedniki (w praktyce, dla czytelności, zamienia się też znaki większości). Nie, kanał RSS nie jest dokumentem HTML i stosowanie w nim encji HTML to raczej głupi pomysł — dokument przestaje być poprawny.

RSS przewiduje dwa formaty podawania dat. Wersja 1.0 i wcześniejsze stosowały kosmiczne kodowanie W3C, wersja 2.0 podaje czas w standardzie RFC 822. Używanie pierwszego wariantu w RSS 2.0 jest błędem.

Gdyby 10przykazan miało przetwarzać tylko poprawne dokumenty, to musiałbym usunąć z serwisu wszystkie blogi, które nie są oparte o WordPressa.

Technorati Tags: , , ,