Сжечь на костре! Я за дровами, а ты неси святой огонь инквизиции За такой фильм убить не жалко!
— RAMMSTEINГотова на большее - как известный здесь товарищ вменять: "Если этому единица, то что вы откровенному шлаку будете ставить? Знаю, -10!"
Готова на большее - как известный здесь товарищ вменять: "Если этому единица, то что вы откровенному шлаку будете ставить? Знаю, -10!"
— РозАЛекСНа меня намекаешь?
Почитайте Почемука! Он серьезный инженер и математик. Уже обсуждали эти фигни о кривой Гаусса и мат статистике. Заиц-кусаиц! Так их!
Почитайте Почемука! Он серьезный инженер и математик. Уже обсуждали эти фигни о кривой Гаусса и мат статистике. Заиц-кусаиц! Так их!
— ЛисЗачем изобретать велосипед? Можно использовать проверенную временем систему Томаса Байеса как на IMDb и КП. Плюс исключить из статистики неактивных (случайных) пользователей, новичков и неадекватов.
На меня намекаешь?
— trexНе, не намекаю, прямым текстом ))
Зачем изобретать велосипед? Можно использовать проверенную временем систему Томаса Байеса как на IMDb и КП. Плюс исключить из статистики неактивных (случайных) пользователей, новичков и неадекватов.
— trexПрежде чем предлагать какую-то методу, неплохо бы разобраться, что она из себя представляет.
А представляет из себя "система Байеса" не что иное, как банальное демпфирование простого среднего, относительно какой-то величины. В данном случае и на КП и на IMDb за эту величину принимается среднее значение всех оценок по всем фильмам (но можно принять, например 5).
Если абстрактно, то рейтинг фильма принимается за средневзвешенное двух величин: средней оценки фильма и средней оценки всех фильмов. Причем за вес фильма принимается число поданных голосов, а за вес средней оценки всех фильмов какая-то эмпирическая величина. На КП она равна 30, на IMDb - 25000.
Т.е. пока фильм набрал мало голосов, демпфирование сильное и тем больше его рейтинг приближен к "среднему по больнице". А когда набирает достаточно много голосов, то демпфированием можно пренебречь.
Так что, на самом деле, там большой простор для творчества (метода проб и ошибок). Если взять вес "среднего по всей конторе" большим, как на IMDb, то на КК большинство оценок фильмов окажутся так сильно демпфированы, что все будут на одном уровне - среднем по КК. А если принять его малым (например 0), то придем к тому, что и так сейчас имеем.
В принципе, здесь сделано похоже, но проще: рейтинг фильмов с малым числом голосов просто не отображается.
А вот отсечение неадекватов, действительно, вещь полезная. И тут можно применять робастные оценки или отсекать крайние значения по каким-либо статистическим критериям. Только какой это ж будет объем вычислений? Представить страшно.
Прежде чем предлагать какую-то методу, неплохо бы разобраться, что она из себя представляет.
А представляет из себя "система Байеса" не что иное, как банальное демпфирование простого среднего, относительно какой-то величины. В данном случае и на КП и на IMDb за эту величину принимается среднее значение всех оценок по всем фильмам (но можно принять, например 5).
Если абстрактно, то рейтинг фильма принимается за средневзвешенное двух величин: средней оценки фильма и средней оценки всех фильмов. Причем за вес фильма принимается число поданных голосов, а за вес средней оценки всех фильмов какая-то эмпирическая величина. На КП она равна 30, на IMDb - 25000.
Т.е. пока фильм набрал мало голосов, демпфирование сильное и тем больше его рейтинг приближен к "среднему по больнице". А когда набирает достаточно много голосов, то демпфированием можно пренебречь.
Так что, на самом деле, там большой простор для творчества (метода проб и ошибок). Если взять вес "среднего по всей конторе" большим, как на IMDb, то на КК большинство оценок фильмов окажутся так сильно демпфированы, что все будут на одном уровне - среднем по КК. А если принять его малым (например 0), то придем к тому, что и так сейчас имеем.
В принципе, здесь сделано похоже, но проще: рейтинг фильмов с малым числом голосов просто не отображается.
А вот отсечение неадекватов, действительно, вещь полезная. И тут можно применять робастные оценки или отсекать крайние значения по каким-либо статистическим критериям. Только какой это ж будет объем вычислений? Представить страшно.
— КощеюшкаМолодец, что обращаешь внимание. Но мой ответ исчез. Теперь разбирайся сам, у меня времени мало.
Я отвечал на каждый твой пункт, но как видно не судьба.
Десятки десятками, порой можно понять: любимый актёр, жанр, режиссёр и т.п. Но единицу "Облачному атласу" , имея претензии лишь к тому, что фильм непонят
— РозАЛекССжечь на костре! Я за дровами, а ты неси святой огонь инквизиции За такой фильм убить не жалко!