网络电影数据库是什么?

网络电影数据库是什么?,第1张

网上电影数据库是一个介绍英国、美国和意大利电影的英文网站,它基本上覆盖了当今世界上优秀的电影和电影人的资料。在主页上,你可以选择所要查询的国家,也可以直接进入搜索引擎。它提供了按照电影名称、电影人姓名、上映日期、电影角色和出品国家进行查询的方法,各种资料、信息都可找到。如:电影名流的详细资料、奥斯卡历届所有奖项的获奖者和提名者的名单等。它还提供与其他电影网址的连接,你可以轻松地获得其他的电影网址。

http://www.imdb.cn/

IMDB全称Internet Movie Database(互联网电影数据库),其前身是一个名叫“rec.arts.movies”的Usenet新闻组。当时一群热心影迷自发地组织起来,列出影片的演职员表,并为已故影人撰写小传(那时称作“死亡名单”)。

1990年10月17日,IMDB的奠基人Col Needham写了一系列Unix程序,使得所有信息成为可搜索数据,这项至关重要的功能使新闻组上的信息变得更有用、更有意义,直到现在,强大无比的交叉搜索功能还是IMDB的天字招牌。

1993年,IMDB.com正式启动,成为互联网上第一个完全以电影为内容的网站。之后6年,这个网站不断发展壮大,在美国各大校园网中出现镜像,提交电影信息的用户也越来越多(IMDB的写入权力是开放的)。

1995年,随着海量数据带来的信息拥堵、对员工人数的进一步要求,IMDB走上另一个十字路口。Col Needham辞掉了他的正式工作,用自己的xyk买下了第一台服务器,并使IMDB公司化。

1998年,IMDB的信息量继续以几何级数增长,民间自愿贡献的服务器空间很快耗尽,所有义务工作的编辑人员也被无穷无尽的处理工作淹没,所幸的是,全球最大电子商务网站A鄄mazon.com的创始人杰夫·贝索斯买下了IMDB,使那些“白干活”的义工们终于拿到了薪水。

2001年3月,IMDB启动了帮助小演员成名的“宣传照”服务,2002年1月,专门针对业内人士的收费网站IMDbPro.com启动。

以下是IMDB中文网站:http://www.imdb.cn/

[注:本站IMDb.cn致力于收集全球电影中文详细资料,

本站域名前缀IMDb全称为Internet Movie Database,加上.cn意为因特网电影数据库中文网.

特此声明:本站与美国的imdb.com无任何关系,请不要将本站与别站相混合.]

IMDB是目前全球互联网中最大的一个电影资料库,里面包括了几乎所有的电影,以及1982年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级,评论等,我们用的最多的也就是IMDB的得分。而IMDB的得分又是如何来的呢?它的可靠性又有多少呢?让我们通过《魔戒1:护戒使者》来做具体分析吧,先看这张图——

这张图就是魔戒1的所有评分者的分数的一个条状统计图。

从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分的。

图下面有两个分值,一个是算术平均值(arithmetic mean),一个是中值(median)。算术平均值大概就是平均数,中值是统计学中的中间数值,该值和比它大及比它小的数值是等差的。而最后我们查到的分数却既不是算术平均值,也不是中值。

IMDB的分数的计算方法应该不是就做一下平均就ok了,在它的网页上也提到了它的计算方法是保密的。不过imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:

weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

其中:

R = average for the movie (mean) = (Rating) (是用普通的方法计算出的骄�郑?br>v = number of votes for the movie = (votes) (投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)

m = minimum votes required to be listed in the top 250 (currently 1250) (进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)

C = the mean vote across the whole report (currently 6.9) (目前所有电影的平均得分)

另外重点来了,根据这个注释:

note: for this top 250, only votes from regular voters are considered.

只有'regular voters'的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某种电影的fans拉票而影响top 250结果,把top 250尽量限制在资深影迷投票范围内的主要方法。regular voter的标准不详,估计至少是“投票电影超过xxx部以上”这样的水平,搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不行。

因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的分数是不同的。以魔戒1为例,它在自己的页面 http://www.imdb.com/title/tt0120737/ 中的分数是8.8,而列表中是8.7。一般250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。这大概是因为regular voter对于电影的要求通常较高的关系。)

而IMDB的过人之处不仅仅在于这儿,它除了给出分数,还给了一个更详细的投票人的列表

这个chart(图表)根据年龄、性别、国别等不同的情况,列出了不同的分数chart。而且你点击每个选项,上面(就是图一)都会出现一个不同的chart。这个其实是比较有用的。比如你在要选择动画片的时候,就应该点选一下小于18岁,或者30-44岁这个选项看看他们的评分,因为他们才是这部电影的最大观众群,其他人的分数都是仅供参考的。

碟报员或者我们在选择影片的时候,可以不仅仅看个总得分,多花一点时间,看看影片各个年龄段的得分会更有帮助的。有些影片我们觉得不好看,但是分数很高,你也可以参照一下,“us users”和“non-us users”这部分的数据,如果美国投票用户远远大于海外用户,那说明此片的确是有相当重的美国文化底蕴的,不觉得好看也是正常。相反的,如果我们觉得不错,但是IMDB的分数很低,这也许是老美的评分人数多,打的分低,就把总分给拉下来了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9916929.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存