FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy
RejestracjaRejestracja  Galeria AvatarówGaleria Avatarów  ZalogujZaloguj
 Ogłoszenie 
Forum archiwalne, nie można zakładać nowych kont.

Poprzedni temat :: Następny temat
  "Być może zainteresowałoby cię również..."
Wersja do druku
tilk Płeć:Mężczyzna


Dołączył: 24 Lip 2003
Status: offline

Grupy:
Alijenoty
PostWysłany: 12-06-2009, 13:29   "Być może zainteresowałoby cię również..."

Bawiłem się ostatnio pomysłem automatycznego wyszukiwania podobnych (według pewnych kryteriów) tytułów do zadanego. Tym, co na razie z tego wyszło, można pobawić się pod adresem:

http://anime.tanuki.pl/podobne.php?aid=50 (gdzie trzeba sobie wpisać numer danego tytułu, wzięty z adresu recenzji)

Pomysł jest na razie taki, że każdej parze tytułów przydzielam "punkty podobieństwa" na podstawie różnych kryteriów - obecnie jest to obecność tych samych technikaliów, tych samych wyróżników i bycie podobnie ocenionym przez redaktorów. Jeśli kiedyś doczekamy się indywidualnych kont, będzie można brać też pod uwagę oceny użytkowników.

Z listy usuwam tytuły będące w tej samej grupie - po pierwsze dlatego, że zapychają czołowe pozycje, a po drugie, ponieważ na stronie recenzji tytuły z grupy są już wylistowane i nie ma sensu ich powtarzać.

System na pewno wymaga dostrojenia - między innymi będzie trzeba sensownie dobrać względną ważność różnych kryteriów. Wydaje mi się, że już na chwilę obecną wyniki nie są najgorszej jakości.
Przejdź na dół Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź blog autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
1543661
Keii Płeć:Mężczyzna
Hasemo


Dołączył: 16 Kwi 2003
Skąd: Tokio
Status: offline

Grupy:
AntyWiP
PostWysłany: 12-06-2009, 13:32   

Wygląda ciekawie i na pewno byłoby przydatne.
Na razie zerrorowałem się, widząc że do Ourana podobne są FLCL i NHK ni youkoso :D

_________________
FFXIV: Vern Dae - Durandal
PSO2: ハセモ - Ship 01
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź listę obejrzanych anime / przeczytanych mang
wa-totem Płeć:Mężczyzna
┐( ̄ー ̄)┌


Dołączył: 03 Mar 2005
Status: offline

Grupy:
Fanklub Lacus Clyne
WIP
PostWysłany: 12-06-2009, 13:39   

O, fajne :)

przeklikałem sobie podobnymi od linku wyżej... Toradora wszędzie, z jakichś powodów. Ale już Ghost Hunt --> Toaru Majutsu no Index wyszło nieźle.

_________________
笑い男: 歌、酒、女の子                DRM: terror talibów kapitalizmu
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
3869750
Avellana Płeć:Kobieta
Lady of Autumn


Dołączyła: 22 Kwi 2003
Status: offline
PostWysłany: 12-06-2009, 13:45   

Hmmm, mam mieszane uczucia. W każdym przypadku listowania dawało jakieś sensowne propozycje, ale dawało także propozycje bardzo nonsensowne - na przykład rzeczony Ouran został wylistowany jako podobny do Mushishi. Trzeba by zobaczyć, ile w tym przypadku da właśnie "strojenie".

Na razie widzę na pewno, że z nieznanych przyczyn w rozmaitych przypadkach poleca jako podobną kontynuację czegoś - np. jako podobne do Akikan pojawia się Magister Negi Magi Negima!? Summer Special!? (i Spring Special), ale nie sama seria...

_________________
Hey, maybe I'll dye my hair, maybe I move somewhere...
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
tilk Płeć:Mężczyzna


Dołączył: 24 Lip 2003
Status: offline

Grupy:
Alijenoty
PostWysłany: 12-06-2009, 14:15   

Rozszerzyłem stronę testową, żeby podawała wartości trzech używanych kryteriów - wyróżników, technikaliów i ocen redaktorów. To powinno pomóc w badaniu, dlaczego tytuły obecne na listach mają taką pozycję, a nie inną.

To nie jest żadna sztuczna inteligencja, komputer nie może wiedzieć, czy jakieś tytuły rzeczywiście są podobne, czy nie. Użyte kryteria są co najwyżej dobrą poszlaką. Perfekcyjnych powiązań na pewno nigdy nie będzie, będą co najwyżej mniej więcej dobre.
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź blog autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
1543661
Avellana Płeć:Kobieta
Lady of Autumn


Dołączyła: 22 Kwi 2003
Status: offline
PostWysłany: 12-06-2009, 14:29   

Toteż ja rozumiem, że to nie będzie przydatne przy tytułach "trudnych", przy Mushishi i Utenie zawsze wyjdą dziwne rzeczy - chociaż szczerze mówiąc, zaskoczyło mnie: przy Mushishi podało bardzo przytomny zestaw: Natsume Yuujichou, Księżniczka Mononoke, Mononoke, Spirited Away. Niestety także Ouran, Genshikena i Nodame Cantabile...

Natomiast ma to sens przy prostszych rzeczach typu ecchi haremówki i chyba na tym bym się bardziej skoncentrowała, przy czym nadanie "wagi" poszczególnym wyróżnikom miałoby pewnie sporo sensu. Największe wątpliwości mam do kryterium ocen redakcji - wydaje mi się, że przy 10-stopniowej skali za łatwo tutaj o jakieś przypadkowe zbieżności, które w niektórych przypadkach będą dawać dziwne trafienia. Zastanawiam się, czy dobrym kryterium nie byłby też rok produkcji - nie tak całkiem dokładnie, ale na zasadzie, że jeśli seria powstała w latach (1990-2000), to ma jakieś dodatkowe punkty podobieństwa do serii z tego samego przedziału czasowego. To ma sens o tyle, że oddalałoby tytuły bardzo nowe od bardzo starych.

Nie wiem, czy to jest możliwe, ale zastanawiam się nad tym, czy - skoro wyeliminowałeś wyświetlanie się tytułów z tej samej grupy - dałoby się pójść o krok dalej i zrobić tak, żeby z danej grupy wyświetlał się jeden, najwcześniejszy pasujący tytuł (najwcześniejszy = rok powstania). Chodzi o to, żeby na przykład w takim przypadku: http://anime.tanuki.pl/podobne.php?aid=361 nie wyświetlały się losowe serie Slayers, tylko żeby poza Slayers reszta tytułów z tej grupy została wyeliminowana, robiąc miejsce dla czegoś innego.

Pytanie pomocnicze: w tej chwili, do testów, nie jest to może konieczne, ale może warto ustalić jakieś "graniczne wartości" podobieństwa. W sensie, że jeśli domyślnie wyświetlane jest 10 tytułów, to jeśli nie znajdzie 10 spełniających odpowiedni stopień podobieństwa, wyświetli mniej. To by miało szanse obciąć trochę dziwnych wyników przy tych oryginalniejszych tytułach.

I na koniec ciekawostka (bardzo przytomny zestaw!): http://anime.tanuki.pl/podobne.php?aid=1288 - popatrzcie, automat też uważa, że Tylor jest podobny do Harlocka!

_________________
Hey, maybe I'll dye my hair, maybe I move somewhere...
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
Teukros Płeć:Mężczyzna


Dołączył: 09 Cze 2006
Status: offline
PostWysłany: 12-06-2009, 14:38   

Mechanizm działa bardzo przyzwoicie, i daje zaskakująco dobre wyniki. Natomiast na przykładzie http://anime.tanuki.pl/podobne.php?aid=1213 (Code Geass) widać, że faktycznie warto wprowadzić punkty za zbliżony czas powstania - Generał Daimos nie jest tak całkiem bez sensu w tym zestawieniu, ale można mieć pewność, że fani CG raczej by się nim nie zainteresowali.
Powrót do góry
Zobacz profil autora Wyślij prywatną wiadomość Odwiedź stronę autora Odwiedź listę obejrzanych anime / przeczytanych mang
Daerian Płeć:Mężczyzna
Wędrowiec Astralny


Dołączył: 25 Lut 2004
Skąd: Przestrzeń Astralna (Warszawa)
Status: offline

Grupy:
Tajna Loża Knujów
PostWysłany: 12-06-2009, 14:43   

Przepraszam, ale skąd bierzecie numer recenzji? Bo w Harlocku podanym przez Ave w adresie ja mam 1332, Ave podaje 1288.
Podobnie, jak przeklejam numer z DMC (chciałem sprawdzić swoje recenzje) to dostaje podobne do Baccano!

Edit: Moja wina, już widzę. Przepraszam za kłopot.

Witch Hunter Robin dostaje niestety dość oddalone wyniki: http://anime.tanuki.pl/podobne.php?aid=258 choć z drugiej strony, ja sam lubię większość wymienionych serii (jeśli je znam), więc może program jest inteligentniejszy niż sądzę ;-)

Natomiast na ile wiem, Toradora! http://anime.tanuki.pl/podobne.php?aid=1342 , SPC http://anime.tanuki.pl/podobne.php?aid=1221 i Kenshin http://anime.tanuki.pl/podobne.php?aid=364 mają całkiem niezłe wyniki.

_________________


Ostatnio zmieniony przez Daerian dnia 12-06-2009, 14:53, w całości zmieniany 1 raz
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość
 
Numer Gadu-Gadu
3291361
Grisznak
-Usunięty-
Gość
PostWysłany: 12-06-2009, 14:50   

Średnio to widzę. O ile w przypadku uznawania podobieństwa przez redaktorów miałoby to sens, tak w przypadku zestawiania ocen i wyznaczników - nie za bardzo.
Powrót do góry
tilk Płeć:Mężczyzna


Dołączył: 24 Lip 2003
Status: offline

Grupy:
Alijenoty
PostWysłany: 12-06-2009, 14:58   

Kryterium oceny redakcji wydaje się intuicyjnie dobre, wszak istnienie osób, którym podoba się i jeden, i drugi tytuł, jest dokładnie tym, o co nam chodzi - czyli o wskazanie czytelnikowi innego tytułu, który może mu się spodobać! Być może źle zrobiłem, nazywając skrypt "podobne".

Zmieniłem trochę kryteria, zwiększając nieco ważność wyróżników, a zmniejszając - ocen redakcji. Czy jest lepiej - ciężko mi powiedzieć.

Odnośnie grup - powiązania są liczone na zasadzie tytuł z tytułem, więc trzeba by się zastanowić, co w takim przypadku robić z tytułami w grupie, które mogą być przecież różnie punktowane. Uśrednianie nie wydaje się dobrym pomysłem, ponieważ może zakopać tytuły, które mają dość różnorodne grupy.


Grisznak: Jesteś pewnie świadomy, że wpisywanie takich powiązań dla każdego tytułu w bazie to ogromna ilość pracy, a i tak z dobrymi powiązaniami dla tytułów (naszym zdaniem) słabszych będzie trudno. Automatyczny system zaś ma tę zaletę, że nie wymaga kłopotliwego wprowadzania dodatkowych danych.
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź blog autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
1543661
Teukros Płeć:Mężczyzna


Dołączył: 09 Cze 2006
Status: offline
PostWysłany: 12-06-2009, 15:46   

Po namyśle, proponuję całkowicie usunąć z kryteriów oceny redaktorów; nie pasują do nich z kilku względów.

Wydaje się, że należy zdecydować się, w którym kierunku idziemy - czy mechanizm ma podawać tytuły podobne, czy tytuły, które spodobają się czytelnikowi. Różnica jest między nimi dosyć istotna. Przykładowo, bardzo podobały mi się Patlabor 2 i Simoun, mimo że nie ma między nimi żadnego podobieństwa; z kolei Patlabor 2 i Patlabor WXIII są bardzo podobne, co z tego, skoro Patlabor WXIII uważam za film dosyć przeciętny.

Niezależnie od tego, które założenie przyjmiemy, oceny redakcji do niego nie pasują. W przypadku "tytułów podobnych", oceny redakcji nijak się mają do podobieństwa. Przywołując powyższe przykłady, Utenie dałem 10, a Patlabor 2 9 - a są to skrajnie różne filmy. Powiedziałbym wręcz, że dodawanie ocen redakcji zaciemnia sprawę, i sprzyja dziwnym powiązaniom w rodzaju "Lucky Star pasuje do Black Lagoon".

Jeżeli tytuły łączymy na zasadzie "to też będzie się podobać", występuje ten sam problem co wyżej. Dodatkowo, o ile można stosunkowo łatwo wskazać, co jest podobne, orzeczenie na podstawie ocen o "lubialności" jest wyjątkowo ryzykowne.

Wreszcie, trzeba sobie powiedzieć, że oceny wystawiane są często po głębokiej kontemplacji sufitu, kryteria ich przyznawania dziko się różnią pomiędzy recenzentami i niekiedy pozostają bez związku z treścią recenzji. Trafiają się też oceny pozamerytoryczne (np. "tak głupie, że aż fazowe, dam 6", albo "nie wiem co dać, dam 7"). Natomiast w przeciwieństwie do ocen, technikalia dosyć dobrze oddają charakter serii.

Mając powyższe na uwadze, proponuję wyrzucenie z zestawienia ocen, i skoncentrowanie się na podobieństwach - na tyle, na ile jest to możliwe na podstawie danych w technikaliach.
Powrót do góry
Zobacz profil autora Wyślij prywatną wiadomość Odwiedź stronę autora Odwiedź listę obejrzanych anime / przeczytanych mang
tilk Płeć:Mężczyzna


Dołączył: 24 Lip 2003
Status: offline

Grupy:
Alijenoty
PostWysłany: 12-06-2009, 16:28   

Teukros, nie zgadzam się z twoją argumentacją. Odnośnie podobieństwa - owszem, w ten sposób możemy znaleźć tytuły bardzo odległe, więc zgodność ocen jest żadną miarą podobieństwa. Jednak w kwestii wyszukiwania innych, które mogą się spodobać, sytuacja jest zupełnie inna. Jeśli z ocen wynika, że wielu redaktorom pewne dwa tytuły się podobają jednocześnie, nawet jeśli są drastycznie różne, to chyba coś jest na rzeczy.

Uwaga dotycząca "dziko różnych kryteriów" jest nietrafiona, bo system nie porównuje ocen pomiędzy recenzentami - patrzy tylko na recenzentów, którzy ocenili jeden i drugi tytuł z każdej pary. Więc każdy może oceniać po swojemu, a i tak podobieństwa ocen stanowią sensowne dane.

Nie mówię, że powinno to być główne kryterium, ale jako pomocnicze jest zupełnie w porządku. Zamiast filozofować, proponuję przejrzeć parę list i zobaczyć, czy wpływ ocen redakcji poprawia listy, czy je psuje. Z moich wstępnych oględzin wynika, że raczej poprawia. Jednym z powodów poprawy jest na przykład to, że doliczanie ocen redakcji zmniejsza szansę, że jako tytuł podobny do dobrego pojawi się zbliżony tematycznie gniot.
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Wyślij email Odwiedź stronę autora Odwiedź blog autora Odwiedź galerię autora Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
1543661
wa-totem Płeć:Mężczyzna
┐( ̄ー ̄)┌


Dołączył: 03 Mar 2005
Status: offline

Grupy:
Fanklub Lacus Clyne
WIP
PostWysłany: 12-06-2009, 19:09   

tilk napisał/a:
Toteż ja rozumiem, że to nie będzie przydatne przy tytułach "trudnych", przy Mushishi i Utenie zawsze wyjdą dziwne rzeczy - chociaż szczerze mówiąc, zaskoczyło mnie: przy Mushishi podało bardzo przytomny zestaw: Natsume Yuujichou, Księżniczka Mononoke, Mononoke, Spirited Away. Niestety także Ouran, Genshikena i Nodame Cantabile...

Przemyśliwałem nad tym chwilkę, i wyszło mi że jedyne co pozwoliłoby dalej poprawić sytuację to nieco bardziej skomplikowane operacje logiczne z użyciem wyróżników.

Chodzi mi o coś takiego:
Anime A 1 2 4 5
Anime B 1 2 3 5 6

Teoretycznie, mamy zbieżność - pokrywają się 3 na 5 możliwych par wyróżników.

Dopasowanie możnaby poprawić, gdyby istniała tabela wykluczeń - czyli np. jeżeli anime dla którego szukamy podobnych ma wyróżniki 4 ORAZ 5, to z listy bez względu na stopień pokrycia należy usuwać anime z wyróżnikiem 6.

Pytanie na ile posiadana siatka wyróżników pozwoliłaby tą drogą eliminować "dziwactwa".

Inna metoda, to przypisanie różnych "wag" pokrywaniu się wyróżników z różnych "grup". Tu zakładam że w bazie funkcjonują one tak, że da się jakoś sensownie je grupować...

_________________
笑い男: 歌、酒、女の子                DRM: terror talibów kapitalizmu
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość Odwiedź listę obejrzanych anime / przeczytanych mang
 
Numer Gadu-Gadu
3869750
Daerian Płeć:Mężczyzna
Wędrowiec Astralny


Dołączył: 25 Lut 2004
Skąd: Przestrzeń Astralna (Warszawa)
Status: offline

Grupy:
Tajna Loża Knujów
PostWysłany: 12-06-2009, 19:18   

Toradora - Kodomo no Jikan... brrr!

http://anime.tanuki.pl/podobne.php?aid=258 - Witch Hunter Robin nadal fatalnie.

http://anime.tanuki.pl/podobne.php?aid=1221 (SPC) - nie ma pierwszej serii Slayers, jest 2 i 3. Ale ogólnie, dobrze.

Kenshin chyba się poprawił.

_________________
Powrót do góry Zobacz profil autora
Zobacz profil autora Wyślij prywatną wiadomość
 
Numer Gadu-Gadu
3291361
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików
Możesz ściągać załączniki
Dodaj temat do Ulubionych


Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group