谷歌背后的数学( 五 )


在更细致的分类中, 这种每一列的矩阵元之和都为 1 的随机矩阵称为左随机矩阵 (left stochastic matrix), 以区别于每一行的矩阵元之和都等于 1 的所谓右随机矩阵 (right stochastic matrix) 。这两者在应用上基本是等价的, 区别往往只在于约定 。
这种几乎满足随机矩阵条件, 但有些列 (或行) 的矩阵元之和小于 1 的矩阵也有一个名称, 叫做亚随机矩阵 (substochastic matrix) 。
确切地说, 这种所有矩阵元都为正的矩阵不仅是素矩阵, 而且还是所谓的正矩阵 (positive matrix) 。这两者的区别是: 正矩阵要求所有矩阵元都为正, 而素矩阵只要求自己的某个正整数次幂为正矩阵 。
读者们想必看出来了, p 其实是矩阵 G 的本征值为 1 的本征向量, 而利用虚拟用户确定网页排序的思路其实是在用迭代法解决上述本征值问题 。在数学上可以证明, 上述本征向量是唯一的, 而且G 的其它本征值 λ 全都满足 |λ|<1 (更准确地说, 是 |λ|≤α ——这也正是 Gnp0 的收敛速度与 α 有关的原因) 。
当然, 这绝不意味着在网页排序上已不可能再做假 。相反, 这种做假在互联网上依然比比皆是, 比如许多广告或垃圾网页制造者用自动程序到各大论坛发贴, 建立对自己网页的链接, 以提高排序, 就是一种常见的做假手法 。为了遏制做假, 谷歌采取了很多技术手段, 并对有些做假网站采取了严厉的惩罚措施 。这种惩罚 (有时是误罚) 对于某些靠互联网吃饭的公司有毁灭性的打击力 。
从投资角度讲, 斯坦福大学显然是过早卖掉了股票, 否则获利将更为丰厚 。不过, 这正是美国名校的一个可贵之处, 它们虽擅长从支持技术研发中获利, 却并不唯利是图 。它们有自己的原则, 那就是不能让商业利益干扰学术研究 。为此, 它们通常不愿长时间持有特定公司的股票, 以免在无形中干扰与该公司存在竞争关系的学术研究的开展 。
那些研究与 “佩奇排序” 的类似仅仅在于大方向 (即都利用互联网的链接结构来决定网页排序), 而非具体算法类似 。