Добро пожаловать на сайт любителей кино!

Фильмы, рецензии, рейтинги и общение.

Входите или Регистрируйтесь.
Facebook 32 Vk 32 Twitter 32

Кинофорум

ФорумыБолтология → IMDB и КК. рейтинг

Сообщения (83)

rammsteinfan
  • Киновед
  • Thu, 24 Jul 2014 01:22:42 +0400

Десятки десятками, порой можно понять: любимый актёр, жанр, режиссёр и т.п. Но единицу "Облачному атласу" excl, имея претензии лишь к тому, что фильм непонят cry

РозАЛекС

Сжечь на костре! mad Я за дровами, а ты неси святой огонь инквизиции wink За такой фильм убить не жалко!

rozadavletova

Сжечь на костре! mad Я за дровами, а ты неси святой огонь инквизиции wink За такой фильм убить не жалко!

RAMMSTEIN

mrgreen Готова на большее - как известный здесь товарищ вменять: "Если этому единица, то что вы откровенному шлаку будете ставить? Знаю, -10!"

TEKTONIC
  • Киновед
  • Thu, 24 Jul 2014 11:38:27 +0400
trex7373
  • Киновед
  • Thu, 24 Jul 2014 13:27:39 +0400

mrgreen Готова на большее - как известный здесь товарищ вменять: "Если этому единица, то что вы откровенному шлаку будете ставить? Знаю, -10!"

РозАЛекС

На меня намекаешь? wink

sergeibolshakov
  • Киновед
  • Thu, 24 Jul 2014 16:43:58 +0400

Почитайте Почемука! Он серьезный инженер и математик. Уже обсуждали эти фигни о кривой Гаусса и мат статистике. Заиц-кусаиц! Так их! mrgreen wink

trex7373
  • Киновед
  • Thu, 24 Jul 2014 16:49:15 +0400

Почитайте Почемука! Он серьезный инженер и математик. Уже обсуждали эти фигни о кривой Гаусса и мат статистике. Заиц-кусаиц! Так их! mrgreen wink

Лис

Зачем изобретать велосипед? Можно использовать проверенную временем систему Томаса Байеса как на IMDb и КП. Плюс исключить из статистики неактивных (случайных) пользователей, новичков и неадекватов.

rozadavletova

На меня намекаешь? wink

trex

Не, не намекаю, прямым текстом ))

Durban-Batyr

Зачем изобретать велосипед? Можно использовать проверенную временем систему Томаса Байеса как на IMDb и КП. Плюс исключить из статистики неактивных (случайных) пользователей, новичков и неадекватов.

trex

Прежде чем предлагать какую-то методу, неплохо бы разобраться, что она из себя представляет.

А представляет из себя "система Байеса" не что иное, как банальное демпфирование простого среднего, относительно какой-то величины. В данном случае и на КП и на IMDb за эту величину принимается среднее значение всех оценок по всем фильмам (но можно принять, например 5).

Если абстрактно, то рейтинг фильма принимается за средневзвешенное двух величин: средней оценки фильма и средней оценки всех фильмов. Причем за вес фильма принимается число поданных голосов, а за вес средней оценки всех фильмов какая-то эмпирическая величина. На КП она равна 30, на IMDb - 25000.

Т.е. пока фильм набрал мало голосов, демпфирование сильное и тем больше его рейтинг приближен к "среднему по больнице". А когда набирает достаточно много голосов, то демпфированием можно пренебречь.

Так что, на самом деле, там большой простор для творчества (метода проб и ошибок). Если взять вес "среднего по всей конторе" большим, как на IMDb, то на КК большинство оценок фильмов окажутся так сильно демпфированы, что все будут на одном уровне - среднем по КК. А если принять его малым (например 0), то придем к тому, что и так сейчас имеем.

В принципе, здесь сделано похоже, но проще: рейтинг фильмов с малым числом голосов просто не отображается.

А вот отсечение неадекватов, действительно, вещь полезная. И тут можно применять робастные оценки или отсекать крайние значения по каким-либо статистическим критериям. Только какой это ж будет объем вычислений? Представить страшно.

trex7373
  • Киновед
  • Thu, 24 Jul 2014 22:47:31 +0400

Долбаный сайт, ятут много написАл, и всё ушло в никуда! thumbsdown

trex7373
  • Киновед
  • Thu, 24 Jul 2014 22:49:55 +0400

Прежде чем предлагать какую-то методу, неплохо бы разобраться, что она из себя представляет.

А представляет из себя "система Байеса" не что иное, как банальное демпфирование простого среднего, относительно какой-то величины. В данном случае и на КП и на IMDb за эту величину принимается среднее значение всех оценок по всем фильмам (но можно принять, например 5).

Если абстрактно, то рейтинг фильма принимается за средневзвешенное двух величин: средней оценки фильма и средней оценки всех фильмов. Причем за вес фильма принимается число поданных голосов, а за вес средней оценки всех фильмов какая-то эмпирическая величина. На КП она равна 30, на IMDb - 25000.

Т.е. пока фильм набрал мало голосов, демпфирование сильное и тем больше его рейтинг приближен к "среднему по больнице". А когда набирает достаточно много голосов, то демпфированием можно пренебречь.

Так что, на самом деле, там большой простор для творчества (метода проб и ошибок). Если взять вес "среднего по всей конторе" большим, как на IMDb, то на КК большинство оценок фильмов окажутся так сильно демпфированы, что все будут на одном уровне - среднем по КК. А если принять его малым (например 0), то придем к тому, что и так сейчас имеем.

В принципе, здесь сделано похоже, но проще: рейтинг фильмов с малым числом голосов просто не отображается.

А вот отсечение неадекватов, действительно, вещь полезная. И тут можно применять робастные оценки или отсекать крайние значения по каким-либо статистическим критериям. Только какой это ж будет объем вычислений? Представить страшно.

Кощеюшка

Молодец, что обращаешь внимание. Но мой ответ исчез. Теперь разбирайся сам, у меня времени мало.
Я отвечал на каждый твой пункт, но как видно не судьба.