Ogłoszenie |
Forum archiwalne, nie można zakładać nowych kont.
|
"Być może zainteresowałoby cię również..." |
Wersja do druku |
tilk
Dołączył: 24 Lip 2003 Status: offline
Grupy: Alijenoty
|
Wysłany: 12-06-2009, 13:29 "Być może zainteresowałoby cię również..."
|
|
|
Bawiłem się ostatnio pomysłem automatycznego wyszukiwania podobnych (według pewnych kryteriów) tytułów do zadanego. Tym, co na razie z tego wyszło, można pobawić się pod adresem:
http://anime.tanuki.pl/podobne.php?aid=50 (gdzie trzeba sobie wpisać numer danego tytułu, wzięty z adresu recenzji)
Pomysł jest na razie taki, że każdej parze tytułów przydzielam "punkty podobieństwa" na podstawie różnych kryteriów - obecnie jest to obecność tych samych technikaliów, tych samych wyróżników i bycie podobnie ocenionym przez redaktorów. Jeśli kiedyś doczekamy się indywidualnych kont, będzie można brać też pod uwagę oceny użytkowników.
Z listy usuwam tytuły będące w tej samej grupie - po pierwsze dlatego, że zapychają czołowe pozycje, a po drugie, ponieważ na stronie recenzji tytuły z grupy są już wylistowane i nie ma sensu ich powtarzać.
System na pewno wymaga dostrojenia - między innymi będzie trzeba sensownie dobrać względną ważność różnych kryteriów. Wydaje mi się, że już na chwilę obecną wyniki nie są najgorszej jakości. |
|
|
|
|
|
Keii
Hasemo
Dołączył: 16 Kwi 2003 Skąd: Tokio Status: offline
Grupy: AntyWiP
|
Wysłany: 12-06-2009, 13:32
|
|
|
Wygląda ciekawie i na pewno byłoby przydatne.
Na razie zerrorowałem się, widząc że do Ourana podobne są FLCL i NHK ni youkoso :D |
_________________ FFXIV: Vern Dae - Durandal
PSO2: ハセモ - Ship 01
|
|
|
|
|
wa-totem
┐( ̄ー ̄)┌
Dołączył: 03 Mar 2005 Status: offline
Grupy: Fanklub Lacus Clyne WIP
|
Wysłany: 12-06-2009, 13:39
|
|
|
O, fajne :)
przeklikałem sobie podobnymi od linku wyżej... Toradora wszędzie, z jakichś powodów. Ale już Ghost Hunt --> Toaru Majutsu no Index wyszło nieźle. |
_________________ 笑い男: 歌、酒、女の子 DRM: terror talibów kapitalizmu
|
|
|
|
|
Avellana
Lady of Autumn
Dołączyła: 22 Kwi 2003 Status: offline
|
Wysłany: 12-06-2009, 13:45
|
|
|
Hmmm, mam mieszane uczucia. W każdym przypadku listowania dawało jakieś sensowne propozycje, ale dawało także propozycje bardzo nonsensowne - na przykład rzeczony Ouran został wylistowany jako podobny do Mushishi. Trzeba by zobaczyć, ile w tym przypadku da właśnie "strojenie".
Na razie widzę na pewno, że z nieznanych przyczyn w rozmaitych przypadkach poleca jako podobną kontynuację czegoś - np. jako podobne do Akikan pojawia się Magister Negi Magi Negima!? Summer Special!? (i Spring Special), ale nie sama seria... |
_________________ Hey, maybe I'll dye my hair, maybe I move somewhere... |
|
|
|
|
tilk
Dołączył: 24 Lip 2003 Status: offline
Grupy: Alijenoty
|
Wysłany: 12-06-2009, 14:15
|
|
|
Rozszerzyłem stronę testową, żeby podawała wartości trzech używanych kryteriów - wyróżników, technikaliów i ocen redaktorów. To powinno pomóc w badaniu, dlaczego tytuły obecne na listach mają taką pozycję, a nie inną.
To nie jest żadna sztuczna inteligencja, komputer nie może wiedzieć, czy jakieś tytuły rzeczywiście są podobne, czy nie. Użyte kryteria są co najwyżej dobrą poszlaką. Perfekcyjnych powiązań na pewno nigdy nie będzie, będą co najwyżej mniej więcej dobre. |
|
|
|
|
|
Avellana
Lady of Autumn
Dołączyła: 22 Kwi 2003 Status: offline
|
Wysłany: 12-06-2009, 14:29
|
|
|
Toteż ja rozumiem, że to nie będzie przydatne przy tytułach "trudnych", przy Mushishi i Utenie zawsze wyjdą dziwne rzeczy - chociaż szczerze mówiąc, zaskoczyło mnie: przy Mushishi podało bardzo przytomny zestaw: Natsume Yuujichou, Księżniczka Mononoke, Mononoke, Spirited Away. Niestety także Ouran, Genshikena i Nodame Cantabile...
Natomiast ma to sens przy prostszych rzeczach typu ecchi haremówki i chyba na tym bym się bardziej skoncentrowała, przy czym nadanie "wagi" poszczególnym wyróżnikom miałoby pewnie sporo sensu. Największe wątpliwości mam do kryterium ocen redakcji - wydaje mi się, że przy 10-stopniowej skali za łatwo tutaj o jakieś przypadkowe zbieżności, które w niektórych przypadkach będą dawać dziwne trafienia. Zastanawiam się, czy dobrym kryterium nie byłby też rok produkcji - nie tak całkiem dokładnie, ale na zasadzie, że jeśli seria powstała w latach (1990-2000), to ma jakieś dodatkowe punkty podobieństwa do serii z tego samego przedziału czasowego. To ma sens o tyle, że oddalałoby tytuły bardzo nowe od bardzo starych.
Nie wiem, czy to jest możliwe, ale zastanawiam się nad tym, czy - skoro wyeliminowałeś wyświetlanie się tytułów z tej samej grupy - dałoby się pójść o krok dalej i zrobić tak, żeby z danej grupy wyświetlał się jeden, najwcześniejszy pasujący tytuł (najwcześniejszy = rok powstania). Chodzi o to, żeby na przykład w takim przypadku: http://anime.tanuki.pl/podobne.php?aid=361 nie wyświetlały się losowe serie Slayers, tylko żeby poza Slayers reszta tytułów z tej grupy została wyeliminowana, robiąc miejsce dla czegoś innego.
Pytanie pomocnicze: w tej chwili, do testów, nie jest to może konieczne, ale może warto ustalić jakieś "graniczne wartości" podobieństwa. W sensie, że jeśli domyślnie wyświetlane jest 10 tytułów, to jeśli nie znajdzie 10 spełniających odpowiedni stopień podobieństwa, wyświetli mniej. To by miało szanse obciąć trochę dziwnych wyników przy tych oryginalniejszych tytułach.
I na koniec ciekawostka (bardzo przytomny zestaw!): http://anime.tanuki.pl/podobne.php?aid=1288 - popatrzcie, automat też uważa, że Tylor jest podobny do Harlocka! |
_________________ Hey, maybe I'll dye my hair, maybe I move somewhere... |
|
|
|
|
Teukros
Dołączył: 09 Cze 2006 Status: offline
|
Wysłany: 12-06-2009, 14:38
|
|
|
Mechanizm działa bardzo przyzwoicie, i daje zaskakująco dobre wyniki. Natomiast na przykładzie http://anime.tanuki.pl/podobne.php?aid=1213 (Code Geass) widać, że faktycznie warto wprowadzić punkty za zbliżony czas powstania - Generał Daimos nie jest tak całkiem bez sensu w tym zestawieniu, ale można mieć pewność, że fani CG raczej by się nim nie zainteresowali. |
|
|
|
|
|
Daerian
Wędrowiec Astralny
Dołączył: 25 Lut 2004 Skąd: Przestrzeń Astralna (Warszawa) Status: offline
Grupy: Tajna Loża Knujów
|
Wysłany: 12-06-2009, 14:43
|
|
|
Przepraszam, ale skąd bierzecie numer recenzji? Bo w Harlocku podanym przez Ave w adresie ja mam 1332, Ave podaje 1288.
Podobnie, jak przeklejam numer z DMC (chciałem sprawdzić swoje recenzje) to dostaje podobne do Baccano!
Edit: Moja wina, już widzę. Przepraszam za kłopot.
Witch Hunter Robin dostaje niestety dość oddalone wyniki: http://anime.tanuki.pl/podobne.php?aid=258 choć z drugiej strony, ja sam lubię większość wymienionych serii (jeśli je znam), więc może program jest inteligentniejszy niż sądzę ;-)
Natomiast na ile wiem, Toradora! http://anime.tanuki.pl/podobne.php?aid=1342 , SPC http://anime.tanuki.pl/podobne.php?aid=1221 i Kenshin http://anime.tanuki.pl/podobne.php?aid=364 mają całkiem niezłe wyniki. |
_________________
Ostatnio zmieniony przez Daerian dnia 12-06-2009, 14:53, w całości zmieniany 1 raz |
|
|
|
|
Grisznak -Usunięty-
Gość
|
Wysłany: 12-06-2009, 14:50
|
|
|
Średnio to widzę. O ile w przypadku uznawania podobieństwa przez redaktorów miałoby to sens, tak w przypadku zestawiania ocen i wyznaczników - nie za bardzo. |
|
|
|
|
|
tilk
Dołączył: 24 Lip 2003 Status: offline
Grupy: Alijenoty
|
Wysłany: 12-06-2009, 14:58
|
|
|
Kryterium oceny redakcji wydaje się intuicyjnie dobre, wszak istnienie osób, którym podoba się i jeden, i drugi tytuł, jest dokładnie tym, o co nam chodzi - czyli o wskazanie czytelnikowi innego tytułu, który może mu się spodobać! Być może źle zrobiłem, nazywając skrypt "podobne".
Zmieniłem trochę kryteria, zwiększając nieco ważność wyróżników, a zmniejszając - ocen redakcji. Czy jest lepiej - ciężko mi powiedzieć.
Odnośnie grup - powiązania są liczone na zasadzie tytuł z tytułem, więc trzeba by się zastanowić, co w takim przypadku robić z tytułami w grupie, które mogą być przecież różnie punktowane. Uśrednianie nie wydaje się dobrym pomysłem, ponieważ może zakopać tytuły, które mają dość różnorodne grupy.
Grisznak: Jesteś pewnie świadomy, że wpisywanie takich powiązań dla każdego tytułu w bazie to ogromna ilość pracy, a i tak z dobrymi powiązaniami dla tytułów (naszym zdaniem) słabszych będzie trudno. Automatyczny system zaś ma tę zaletę, że nie wymaga kłopotliwego wprowadzania dodatkowych danych. |
|
|
|
|
|
Teukros
Dołączył: 09 Cze 2006 Status: offline
|
Wysłany: 12-06-2009, 15:46
|
|
|
Po namyśle, proponuję całkowicie usunąć z kryteriów oceny redaktorów; nie pasują do nich z kilku względów.
Wydaje się, że należy zdecydować się, w którym kierunku idziemy - czy mechanizm ma podawać tytuły podobne, czy tytuły, które spodobają się czytelnikowi. Różnica jest między nimi dosyć istotna. Przykładowo, bardzo podobały mi się Patlabor 2 i Simoun, mimo że nie ma między nimi żadnego podobieństwa; z kolei Patlabor 2 i Patlabor WXIII są bardzo podobne, co z tego, skoro Patlabor WXIII uważam za film dosyć przeciętny.
Niezależnie od tego, które założenie przyjmiemy, oceny redakcji do niego nie pasują. W przypadku "tytułów podobnych", oceny redakcji nijak się mają do podobieństwa. Przywołując powyższe przykłady, Utenie dałem 10, a Patlabor 2 9 - a są to skrajnie różne filmy. Powiedziałbym wręcz, że dodawanie ocen redakcji zaciemnia sprawę, i sprzyja dziwnym powiązaniom w rodzaju "Lucky Star pasuje do Black Lagoon".
Jeżeli tytuły łączymy na zasadzie "to też będzie się podobać", występuje ten sam problem co wyżej. Dodatkowo, o ile można stosunkowo łatwo wskazać, co jest podobne, orzeczenie na podstawie ocen o "lubialności" jest wyjątkowo ryzykowne.
Wreszcie, trzeba sobie powiedzieć, że oceny wystawiane są często po głębokiej kontemplacji sufitu, kryteria ich przyznawania dziko się różnią pomiędzy recenzentami i niekiedy pozostają bez związku z treścią recenzji. Trafiają się też oceny pozamerytoryczne (np. "tak głupie, że aż fazowe, dam 6", albo "nie wiem co dać, dam 7"). Natomiast w przeciwieństwie do ocen, technikalia dosyć dobrze oddają charakter serii.
Mając powyższe na uwadze, proponuję wyrzucenie z zestawienia ocen, i skoncentrowanie się na podobieństwach - na tyle, na ile jest to możliwe na podstawie danych w technikaliach. |
|
|
|
|
|
tilk
Dołączył: 24 Lip 2003 Status: offline
Grupy: Alijenoty
|
Wysłany: 12-06-2009, 16:28
|
|
|
Teukros, nie zgadzam się z twoją argumentacją. Odnośnie podobieństwa - owszem, w ten sposób możemy znaleźć tytuły bardzo odległe, więc zgodność ocen jest żadną miarą podobieństwa. Jednak w kwestii wyszukiwania innych, które mogą się spodobać, sytuacja jest zupełnie inna. Jeśli z ocen wynika, że wielu redaktorom pewne dwa tytuły się podobają jednocześnie, nawet jeśli są drastycznie różne, to chyba coś jest na rzeczy.
Uwaga dotycząca "dziko różnych kryteriów" jest nietrafiona, bo system nie porównuje ocen pomiędzy recenzentami - patrzy tylko na recenzentów, którzy ocenili jeden i drugi tytuł z każdej pary. Więc każdy może oceniać po swojemu, a i tak podobieństwa ocen stanowią sensowne dane.
Nie mówię, że powinno to być główne kryterium, ale jako pomocnicze jest zupełnie w porządku. Zamiast filozofować, proponuję przejrzeć parę list i zobaczyć, czy wpływ ocen redakcji poprawia listy, czy je psuje. Z moich wstępnych oględzin wynika, że raczej poprawia. Jednym z powodów poprawy jest na przykład to, że doliczanie ocen redakcji zmniejsza szansę, że jako tytuł podobny do dobrego pojawi się zbliżony tematycznie gniot. |
|
|
|
|
|
wa-totem
┐( ̄ー ̄)┌
Dołączył: 03 Mar 2005 Status: offline
Grupy: Fanklub Lacus Clyne WIP
|
Wysłany: 12-06-2009, 19:09
|
|
|
tilk napisał/a: | Toteż ja rozumiem, że to nie będzie przydatne przy tytułach "trudnych", przy Mushishi i Utenie zawsze wyjdą dziwne rzeczy - chociaż szczerze mówiąc, zaskoczyło mnie: przy Mushishi podało bardzo przytomny zestaw: Natsume Yuujichou, Księżniczka Mononoke, Mononoke, Spirited Away. Niestety także Ouran, Genshikena i Nodame Cantabile... |
Przemyśliwałem nad tym chwilkę, i wyszło mi że jedyne co pozwoliłoby dalej poprawić sytuację to nieco bardziej skomplikowane operacje logiczne z użyciem wyróżników.
Chodzi mi o coś takiego:
Anime A 1 2 4 5
Anime B 1 2 3 5 6
Teoretycznie, mamy zbieżność - pokrywają się 3 na 5 możliwych par wyróżników.
Dopasowanie możnaby poprawić, gdyby istniała tabela wykluczeń - czyli np. jeżeli anime dla którego szukamy podobnych ma wyróżniki 4 ORAZ 5, to z listy bez względu na stopień pokrycia należy usuwać anime z wyróżnikiem 6.
Pytanie na ile posiadana siatka wyróżników pozwoliłaby tą drogą eliminować "dziwactwa".
Inna metoda, to przypisanie różnych "wag" pokrywaniu się wyróżników z różnych "grup". Tu zakładam że w bazie funkcjonują one tak, że da się jakoś sensownie je grupować... |
_________________ 笑い男: 歌、酒、女の子 DRM: terror talibów kapitalizmu
|
|
|
|
|
Daerian
Wędrowiec Astralny
Dołączył: 25 Lut 2004 Skąd: Przestrzeń Astralna (Warszawa) Status: offline
Grupy: Tajna Loża Knujów
|
|
|
|
|
|
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików Możesz ściągać załączniki
|
Dodaj temat do Ulubionych
|
|
|
|