朱光潜《谈美书简》读书笔记10篇
朱光潜《谈美书简》读书笔记1
这是朱光潜先生在83岁高龄写给青年的美学入门读物《谈美书简》。朱光潜先生是*现代美学的**人物,是开拓者和创新者,在美学领域是全国的权威,他主张美是主观性与客观性的**。他运用*****的观点来阐明了美和美感的规律、美范畴等一系列问题。
在前言中,朱光潜告诉我们怎样学美学,但我认为更重要的在于,他对我们人生观的引导,如在前言中朱光潜写到“正路并不一定是一条**坦坦的直路,难免有些曲折和崎岖险阻,要绕一些弯,甚至难免误入歧途。哪个重要的科学实验一次就能成功呢?“失败者成功之母”。失败的教训一般比成功的经验更有益”……这些都呈现出一种积极的人生态度。
什么是美?这是一个很基本的问题,但毫无意外地,我们大多数人并不知道它的确切答案。其实从另一个方面来说,美并没有一个具体的标准,每个人对于美都有不同的定义。在《谈美书简》中,朱光潜先生给了我们一个答案,虽然这个答案不一定正确,但至少比毫无头绪要高明许多。
许多人都认为,看过去舒服的就是美的,也许更深一层,会说心灵美也是一种美。但所有的这些都比较浅显的,而深入研究,又是望尘莫及的事了。通常我们对于美、美感、美的规律、美的范畴等等这些问题感到很深奥,也研究甚少,关于这些问题,朱光潜先生在此书中都一并回复了,而且回复的很详尽,对于思想,文学,方法,理论等等也有详细的陈述。对于美,我们看到的都是片面的,也可以说是表面的,而看完这本书,我对于美则有了全新的看法,这也是读此书的收获吧。
朱光潜《谈美书简》读书笔记2
读完《谈美书简》总体感觉就是稀里糊涂,包含了各种不明白。留下鲜明印象的很少而且也模模糊糊的记不清楚,也许是这本书的内容本身就很乏味或者专业性很强,虽然作者也竭力写得明白清楚而不是趣味,最好能达到“深入浅出”的目的。但就我本身而言,一个从为看过听过“美学”,压根不知道有美学存在的人,突然读到一本美学大师谈美学的书,总觉得有些唐突,甚至是不知如何是好,难以应付。
可以做个比喻来形象的诠释我的感觉。
看这本书,就像看T台秀一样。看着各种各样想尽办法创新的时装,却得不偿失的让人看到另类的搞怪,难以接受。但当你知道这是一位知名大师呕心沥血的作品,你就会按奈住自己的烦躁,耐心品位,试图找到一点可以看的过去的地方。但当你发现这样也是徒劳的时候,你又看到别人对这些设计赞不绝口,你便会心生疑惑,不得不从其他方面来寻找乐趣以作消遣。
于是你便会将***转到主体的庞杂部分,比如你会欣赏模特的妆容、身材、造型,或者聆听秀场的音乐,或者研究T台的设计。总之,你会找到主体以外出彩的地方,以便使自己感到欣慰,没有白白的浪费时间,但却忽略了作品本身的内容。
读它,需要静心,在一大堆晦涩难懂的文字中,努力的想寻找到一点能读懂的,能理解作者观点的,但往往是努力与收获不成正比。
和服装***类似,作者也努力的'想做到使文章通俗易懂,但却收效甚微。至少作为万千读者之一的我,确实是在还没弄明白是怎么一回事的情况下就读完了,只留下一些模糊的对美学的认知。当然,这也不能全怪作者。或许是内容涉及知识面太广,含盖内容太多,这就对我像我一样知识面狭窄的读者造成了很多的捆扰。这个问题,即使作者再怎样神通广大也解释不清楚。比如,书中常提到的***、*的著作,我根本就没接触过,试问,我又怎能理解透彻呢?所以,我还是要多读书,多涉猎些不同领域的知识,也许这样,便可以理解此书的内容。
正如看T台一样,如果我看不出精彩的,无法理解晦涩难懂的内容,我就会从其他细节方面来寻找这本书的精彩,好鼓励我继续读下去。作者朱光潜先生,是一位民族责任感很强的人,他对社会学风很是忧虑,也不断鼓励年轻人去打破禁区,为文坛带来清风。他也确实是个“老实人”经常自我反省,不断思考,不断改正,不断进步。他这种务实的科研精神,是他的思想精华,也是这本书的精华。而且,作者在这本书中一直流露出的是谦虚,谨慎的态度。
他的文字也给人一种亲切的感觉,并没有拘人与千里之外的意外,这也是朱光潜先生与其他一些咬文嚼字,拿理论拘人与外,让人心生畏惧的学者的最大不同,这才是真正有学识的表现。“唯有品质好的人才能写出好书才能写出好书”。所以,从这点上来说这本书也有它的可贵之处。
对于这本书,我没有读懂,所以,也不敢枉加评论。只希望以此来记录下读它的心情,也算是一种纪念吧。
朱光潜《谈美书简》读书笔记3
什么是“美”?用莎翁的话说:“这是一个问题。”
但毫无疑问,没有人知道答案,包括历史**何时期的任何一位大师。他们耗尽毕生的精力也只是在人类对美的认知史上留下了自己的见解,但却从未揭开“美”的面纱。其实在我看来,“美”并没有一个具体的标准,因为很少会有人对美的认知完全相同。也就是说,“美”是无定义的。在《谈美书简》中,朱光潜先生引用了他的一位“老朋友”(我怀疑是作者本人)给“美”下的定义,并对其刻板和迂腐进行了深刻的批判。从这里我们不难看出,朱光潜先生也是反对套用空洞的抽象概念去给“美”铸一座密不透风的牢笼的。
在朱光潜先生看来“人是审美的主体,人在改造客观世界时也改造了人本身,人在审美中具有最高的意义,美离不开人。”同时,美也是属于社会价值范畴,它的适用主体是人。这便是说我们要去认识美。
那么我们该如何认识美呢?我的观点是:不需要定义,只需要感受。
但在感受美的过程中,我们要找到正确的'方法。在这一点上,朱光潜先生给了我们十分重要的提示,那便是既要把握对“美”的理性认识,又要注重对“美”感性认识。我认为美是客观存在的,但我们决不能只强调美的客观性而将审美与人的思考力、情感与意识割裂**。审美活动应是一种实践活动,同时因为它具有目的性并且与人类的情感息息相关,所以审美必然要从主观与客观两个角度去进行。否则,就如“形而上学”一样,以孤立、静止、片面的观点认识世界,认为一切事物都是孤立的,永远不变的。这显然与主客观结合的审美以及感性与理性的*衡相矛盾。认识美和感受美一方面要求我们学习一些美学知识,另一方面我们也要注重审美实践,多去参加各种艺术展览,多与他人交流自己对美的看法。在审美的过程中,探求美的真谛未必是我们最终的追求,但享受这个美妙的过程却是我们每个人都必不可少的经验。
而对于《谈美书简》这本书,朱光潜先生以耐心的口吻,以一位**的身份用信件的方式,将自己*生对美学感悟向我们娓娓道来,并对一些重要而关键的问题向美学的入门者们进行了深入的探讨。因而这本书相比较其他美学著作易懂。他在美学问题上对我们的帮助不仅是思想上的,也是方法上的。
朱光潜《谈美书简》读书笔记4
"美是到处都有的,对于我们的眼睛,不是缺少美,而是缺少发现。"——罗丹
我们在进行艺术教育时,常常想的是如何在教授一些美学知识、规律等的同时,逐渐培养学生拥有一双发现美的眼睛,进而敞开心胸地感受美、灵动地创造美。
其实,作为教师,在认识学生方面何尝不需要拥有一双发现美的眼睛呢。
朱光潜先生在《谈美书简》中曾举过一个例子:对于园里那一棵古松,在木材商、植物学家和画家眼里,却是三种不同的东西――在木材商看来,它不过是一棵做某事价值多少钱的木料;在植物学家眼里,它是一棵叶为针状、果为球状、四季常青的显花植物;然而画家却认为它是一棵苍翠挺拔的古树。接下来三个人的反应态度也不一致,木材商在心里盘算它是宜于架屋或是制器,思量怎样去买它、砍它、运它;植物学家马上就会想到要把它归到某类某科里去,注意它和其他松树的异点,思量它何以活得这样老;而画家却只是在聚精会神地观赏它的苍翠的颜色,它的盘屈如龙蛇的线纹以及它的昂然高举、不受屈挠的气概。
我赞同三者眼中对古松的不同状态和不同定位,我更推崇把三者的视角进行综合,更多方位、更多角度地去审视、去构思、去塑造眼前的事物。就如我们作为教师,可以如植物学家一般根据学生的生活环境、学习现状等去判断学生的优势与不足,分析其成因;如画家般去感受学生的个性、体味学生的品格和趣味、挖掘学生不被他人察觉的闪光点;如木材商那样规划学生的前途、思忖学生的发展方向、培养目标。那样,不同的学生才真正地在教师的眼中鲜活起来、立体起来。我们在进行教育教学的同时,才能真正地本着"关爱学生"的原则开展与实施。
就如,有的教师能针对不同学生的优势或特长,安排相对应的工作,使得学生不断地树立自信心,转而在其他方面也有座提高。又如:我们在教学活动的设计过程中,要尽量多的给予学生尝试、锻炼、讨论、交流等活动,让学生从不同的活动中展示自己,让教师全方位地了解学生,发现学生多样的"美";再针对学生的特点,也可以量身定做地安排一些学习活动,使学生更积极地参与学习,获得更多的学习方法。在我的教学实践过程中,曾尝试过多种形式的师生合作示范:仅在语言上进行交流;在绘画方面进行合作;综合语言交流与绘画合作等等。不论哪一种形式,学生在参与教师示范的过程中,都能积极开动脑筋,主动思维,大胆地发表着自己的见解与想法。许多想法由于学生间的差异,会形成教师也想不到的奇思妙想,从而迸发与碰撞出更精妙的思维的火花,学生们的个性因此而得到张扬,学生的生命在教师的呵护与培养中得到发展。
师生的共同示范中,学生亦在教师的配合下,乐于多方面、多角度地思维;在教师的鼓励下,更投入地更专注地进行创作与表现,使得美术课堂中的示范环节也成为了提高学生生命的质量,满足学生心智成长需要,促进学生生命价值体现的一个良好途径。
只有热爱生活,才会享受人生,才能活出精彩,因为生活中并不缺少美,缺少的是发现美的眼睛。教师要善于发现学生的美,为他们搭建更多展示美的舞台,他们的美才能逐渐累积、融合、幻化出更耀眼的光彩。
《谈美书简》采用书信体形式,娓娓道来,作为启蒙式的书籍,将许多深奥的美学知识通俗化,亲切自然。是*现代美学家朱光潜在八十二岁高龄的情况下写就的"暮年心血"之作,既是朱老对自己漫长美学生涯和美学思想的一次回顾和整理,也是"给来信未复的朋友们",尤其是青年朋友们的一次回复。
从书中还可以看出朱老很关心民族、国家的现实与命运,尤其关心青年在现实中的为人处世和道德修养,每位读者只有静下心来,细细地品味与思考,才能领会作者的深层思想。
朱老在书中主张的是要积极地投入现实生活,而不能逃避人生,同时又要以一种审美的心态去面对现实生活,这样才能给现实人生增添美好的色彩。在当今竞争激烈的社会环境、繁忙紧张的工作氛围中,我们也不妨借用朱老提倡的生活态度,才能更主动、积极地投入工作,才能以审美的眼光去了解与发现每一位学生,才能放松地思维、进行发散性思维,在新的教育**大潮中有所创新,有所进步。
朱光潜《谈美书简》读书笔记5
什么是“美”?用莎翁的话说:“这是一个问题。”
但毫无疑问,没有人知道答案,包括历史**何时期的任何一位大师。他们耗尽毕生的精力也只是在人类对美的认知史上留下了自己的见解,但却从未揭开“美”的面纱。其实在我看来,“美”并没有一个具体的标准,因为很少会有人对美的认知完全相同。也就是说,“美”是无定义的。在《谈美书简》中,朱光潜先生引用了他的一位“老朋友”(我怀疑是作者本人)给“美”下的定义,并对其刻板和迂腐进行了深刻的批判。从这里我们不难看出,朱光潜先生也是反对套用空洞的抽象概念去给“美”铸一座密不透风的牢笼的。
在朱光潜先生看来“人是审美的主体,人在改造客观世界时也改造了人本身,人在审美中具有最高的意义,美离不开人。”同时,美也是属于社会价值范畴,它的适用主体是人。这便是说我们要去认识美。
那么我们该如何认识美呢?我的观点是:不需要定义,只需要感受。
但在感受美的过程中,我们要找到正确的方法。在这一点上,朱光潜先生给了我们十分重要的提示,那便是既要把握对“美”的理性认识,又要注重对“美”感性认识。我认为美是客观存在的,但我们决不能只强调美的客观性而将审美与人的思考力、情感与意识割裂**。审美活动应是一种实践活动,同时因为它具有目的性并且与人类的情感息息相关,所以审美必然要从主观与客观两个角度去进行。否则,就如“形而上学”一样,以孤立、静止、片面的观点认识世界,认为一切事物都是孤立的,永远不变的。这显然与主客观结合的审美以及感性与理性的*衡相矛盾。认识美和感受美一方面要求我们学习一些美学知识,另一方面我们也要注重审美实践,多去参加各种艺术展览,多与他人交流自己对美的看法。在审美的过程中,探求美的真谛未必是我们最终的追求,但享受这个美妙的过程却是我们每个人都必不可少的经验。
而对于《谈美书简》这本书,朱光潜先生以耐心的口吻,以一位**的身份用信件的方式,将自己*生对美学感悟向我们娓娓道来,并对一些重要而关键的问题向美学的入门者们进行了深入的探讨。因而这本书相比较其他美学著作易懂。他在美学问题上对我们的帮助不仅是思想上的,也是方法上的。
朱光潜《谈美书简》读书笔记6
"美是到处都有的,对于我们的眼睛,不是缺少美,而是缺少发现。"——罗丹
我们在进行艺术教育时,常常想的是如何在教授一些美学知识、规律等的同时,逐渐培养学生拥有一双发现美的眼睛,进而敞开心胸地感受美、灵动地创造美。
其实,作为教师,在认识学生方面何尝不需要拥有一双发现美的眼睛呢。
朱光潜先生在《谈美书简》中曾举过一个例子:对于园里那一棵古松,在木材商、植物学家和画家眼里,却是三种不同的东西――在木材商看来,它不过是一棵做某事价值多少钱的木料;在植物学家眼里,它是一棵叶为针状、果为球状、四季常青的显花植物;然而画家却认为它是一棵苍翠挺拔的古树。接下来三个人的反应态度也不一致――木材商在心里盘算它是宜于架屋或是制器,思量怎样去买它、砍它、运它;植物学家马上就会想到要把它归到某类某科里去,注意它和其他松树的异点,思量它何以活得这样老;而画家却只是在聚精会神地观赏它的苍翠的颜色,它的盘屈如龙蛇的线纹以及它的昂然高举、不受屈挠的气概。
我赞同三者眼中对古松的不同状态和不同定位,我更推崇把三者的视角进行综合,更多方位、更多角度地去审视、去构思、去塑造眼前的事物。就如我们作为教师,可以如植物学家一般根据学生的生活环境、学习现状等去判断学生的优势与不足,分析其成因;如画家般去感受学生的个性、体味学生的品格和趣味、挖掘学生不被他人察觉的闪光点;如木材商那样规划学生的前途、思忖学生的发展方向、培养目标。那样,不同的学生才真正地在教师的眼中鲜活起来、立体起来。我们在进行教育教学的同时,才能真正地本着"关爱学生"的原则开展与实施。
就如,有的教师能针对不同学生的优势或特长,安排相对应的工作,使得学生不断地树立自信心,转而在其他方面也有座提高。又如:我们在教学活动的设计过程中,要尽量多的给予学生尝试、锻炼、讨论、交流等活动,让学生从不同的活动中展示自己,让教师全方位地了解学生,发现学生多样的"美";再针对学生的特点,也可以量身定做地安排一些学习活动,使学生更积极地参与学习,获得更多的学习方法。在我的教学实践过程中,曾尝试过多种形式的师生合作示范:仅在语言上进行交流;在绘画方面进行合作;综合语言交流与绘画合作等等。不论哪一种形式,学生在参与教师示范的过程中,都能积极开动脑筋,主动思维,大胆地发表着自己的见解与想法。许多想法由于学生间的差异,会形成教师也想不到的奇思妙想,从而迸发与碰撞出更精妙的思维的火花,学生们的个性因此而得到张扬,学生的生命在教师的呵护与培养中得到发展。
师生的共同示范中,学生亦在教师的配合下,乐于多方面、多角度地思维;在教师的鼓励下,更投入地更专注地进行创作与表现,使得美术课堂中的示范环节也成为了提高学生生命的质量,满足学生心智成长需要,促进学生生命价值体现的一个良好途径。
只有热爱生活,才会享受人生,才能活出精彩,因为生活中并不缺少美,缺少的是发现美的眼睛。教师要善于发现学生的美,为他们搭建更多展示美的舞台,他们的美才能逐渐累积、融合、幻化出更耀眼的光彩。
《谈美书简》采用书信体形式,娓娓道来,作为启蒙式的书籍,将许多深奥的美学知识通俗化,亲切自然。是*现代美学家朱光潜在八十二岁高龄的情况下写就的"暮年心血"之作,既是朱老对自己漫长美学生涯和美学思想的一次回顾和整理,也是"给来信未复的朋友们",尤其是青年朋友们的一次回复。
从书中还可以看出朱老很关心民族、国家的现实与命运,尤其关心青年在现实中的为人处世和道德修养,每位读者只有静下心来,细细地品味与思考,才能领会作者的深层思想。
朱老在书中主张的是要积极地投入现实生活,而不能逃避人生,同时又要以一种审美的心态去面对现实生活,这样才能给现实人生增添美好的色彩。在当今竞争激烈的社会环境、繁忙紧张的工作氛围中,我们也不妨借用朱老提倡的生活态度,才能更主动、积极地投入工作,才能以审美的眼光去了解与发现每一位学生,才能放松地思维、进行发散性思维,在新的教育**大潮中有所创新,有所进步。
朱光潜《谈美书简》读书笔记7
《谈美书简》一文中,作者比力详细、完整地解说了在文学与戏剧作品中人物与情况的关系。他起首回顾了这一实际孕育发生与生长的汗青,进而指出,典范人物是可以或许表现社会汗青生长的某些纪律而且具有鲜明个性特点的人物抽象,而典范情况则是典范人物所处的可以或许反应社会汗青生长现状和趋向的详细情景和配景。典范人物应生存在典范情况中,而不能与情况相脱节。在这里,共性是经过个性来表现的,是在特别中显示一样*常。文学之以是能在偶然性中见出一定性,是与再现“典范情况中的典范人物”这一实际分不开的。
固然此书不是一本完整的美学著作,却也从一些很重要很关键的角度对美学的入门者的问题进行了解答,而且在很多方面都很有资助。
类似如许的例子另有许多,在此也就纷歧一详谈了。
朱光潜先生信奉“三此**”,即此身,此时,此地:“此身应该做而且可以或许做的事,就得由此身担当起,不推委给旁人。”“此时应该做而且可以或许做的事,就该在此时做,不拖延到未来。美的历程读后感”“此地(我的职位地方、我的情况)应该做而且可以或许做的事,就得在此地做,不推委到想象中另一职位地方去做。”这是朱光潜先生不尚空谈,脚踏实地的治学精力的表现。这很值得我们青少年去学习。
《谈美书函》不是一样*常的高头讲章,它接纳书信体的情势,娓娓道来,亲切自然,将许多深奥的美学知识普通化。
《谈美书函》是作者在八十二岁高龄的情况下写就的“老年末年心血”之作,它既是对本身漫长美门生活和美学头脑的一次回顾和整理,也是“给来信未复的朋友们”,尤其是青年朋友们的一次复兴。卖火柴小女孩读后感全书由十三封书信结集而成。书中,朱光潜先生就青年朋友们普遍体贴的美和美感、美的纪律、美的领域等一系列美学问题进行了深化的探讨,同时也对文学的审美特性、文学的创作纪律及特点作了详尽的阐释,既是头脑上的,又是要领上的,是初涉美学者学习美学知识的重要参考册本。
八十二岁的高龄仍旧著书立说,对美学头脑回顾和整理,给青年朋友们复兴,体贴美学教诲,这是何等的学者风范和社会责任感!
朱光潜《谈美书简》读书笔记8
从本质上讲,我喜欢读书,喜欢与文字有关的一切,但是我却是一个懒于思考的人,更多的是一个被动的接受者的角色,已经开始读研了,不论现在的研究生有多水,扩招有多么厉害,我想我都应该做一些该做的事情,认真踏实的尽自己所能做一个合格的学生。开学了,没有以往的兴奋和新奇,心里更多了一份沉甸甸的责任,只希望不辜负所有人的热切期盼,不辜负自己心中的信仰。开始认真的读书思考。
最近,读了朱光潜先生的《文艺心理学》,惊叹于先生那融贯中西的学识和过人的思考能力,对自己颇有启发。朱光潜先生在研究文艺美学之时,将**的文艺美学思想和*古典的美学思想融会贯通,并提出了自己独具一格的美学思想,对我国现代当的美学研究提供了宝贵的思想资源和思维方式,朱光潜先生的美学思想深受意大利美学家克罗齐的影响。但是不同于克罗齐的文艺心理学的研究,朱光潜先生更是把视野放在了文艺活动这个大框架来进行文艺美学的研究,其中朱光潜先生提到文艺活动不仅仅是心灵的瞬间感受,是形象的直觉,文艺活动过程从直觉到传达才是一个阶段的完成,而文艺的传达活动更是艺术家区别于普通人,优秀艺术家区别于一般艺术家的不同之处。文艺的传达有赖于艺术家的匠心独运,更和日常的学习密不可分。
艺术家除了要有不同于常人的形象的直觉之外,还需掌握以下知识:一是掌握有关媒介的知识,二是模仿传达的技巧,三是作品的锤炼。艺术家所进行的模仿传达,实际就是艺术家的勤学苦练的过程,艺术家勤于练习才会形成相关的模仿习惯,下笔时才会水到渠成。而这模仿习惯,在朱光潜先生看来主要是模仿筋肉技巧,每种艺术都有其特殊的筋肉技巧,如写字、绘画、雕刻、图画、弹琴都要有手腕上的技巧;唱歌、演戏、吹箫、说话都要有喉舌上的技巧,跳舞要有全身筋肉的技巧,诗文的创作也需练习筋肉的技巧,古人所言的“文以气为主”,这气就是一种肌肉的技巧。
这是我颇为关注的地方,文艺活动中的传达过程竟和人体的筋肉活动有着密切的联系,而这些联系是如何发生的,在现实生活中是否有可解释的地方,我还需要进一步的拜读作品,才能了解朱先生的文艺思想,读书之少,导致所思之浅,现在弥补也许为时不晚。加油吧!
朱光潜《谈美书简》读书笔记9
《谈美书简》,是朱光潜先生一部谈美学的论著。朱光潜先生在美学界的造诣这里无需过多赘述,他是我国研究美学的始祖,一代美学大师。通读完后,首先的感觉是朱先生知识的渊博,旁征博引,学贯中西。在他的书中,古今中外的文献引用得极多,而且所引用的英法德等国关于美的论述都是他最早翻译过来的。
其实粗读一篇,我真没有弄明白到底什么是美。虽然他通篇都在介绍什么是美,从心理学角度、从哲学角度、从自然科学角度去研究、论证美的本质意义。但是我读的还是一头雾水,因为朱先生的思想是那么的深邃;眼光是那么犀利;观点是那么独到。都说读书就是读者和作者心与心的交流,我只觉得朱先生穿着一身长马褂,在某个黄昏的清风中,向我娓娓道来,像一切得道智者一样,他持才并不傲物,从容淡泊,虚怀若谷。对我而言,朱先生只能用“高山仰止,景行行止”来形容了。
那么,到底是什么美?
什么是美?朱光潜先生并没有给出明确的定义。对于一个严谨的科学研究者或者说是理论研究者,简单草率地定义某种事物,总不免会把读者引入歧途甚至会怡笑大方。伟人如柏拉图也曾犯下把人定义成没有羽毛动物的错误,留下了千古笑柄。美不完全是事物的属性,不能科学定性地定义。譬如我们说水,这是可以严格定义的,凡是由2个氢原子和1个氧原子化合而成的物质就是水,这个不会因为不同人有不同看法而改变。
然而我们很多人对美的定义其实都是成为美的条件,我们说脚长的女人比脚短的女人要美,对称的比散乱的要美,但这都是成为美的条件,但具备这些条件的不一定就是美。正如空气含有水分是雨的条件,但空气中的水分却不是雨。因此有人问圣·奥古斯丁:“什么是时间?”,他回答:“你不问我,我本来很清楚地知道他是什么,你问我,我倒觉得茫然了”。
美不能定义,又不是事物固有的属性,那就没有研究价值了吗?朱先生告诉我们,美其实在某种程度上也是事物属性,当我们见到美的事物时,大多数人还是会觉得那是美的。但是研究判别美,不仅要在物本身着眼,同时还要着重观赏者在所观赏物中见到的价值去研究。通俗一点讲,就是美不仅在物,而且在心,在物为刺激,在心为感受。世界上没有天生自在,俯首即拾的美,凡是美都要经过心灵的创造,所以美学研究的理论,不仅要讲艺术,而且要讲心理。作者用了十七章的篇幅在讲美,我才疏学浅,读了多遍亦只是管中窥豹,不能全面真正理解作者所阐述的理论。刚看到这本书的时候,我和大多数人一样都有一个疑问,自已认为美就是美,了解那么多有意义吗?
那么,为什么要研究美?
现实生活中,我们每个人都攀登过山,游玩过水,欣赏过画,背颂过诗文,当我们发现某处景色让我们心情愉悦时,我们会说,这里真美;当我们读到某处诗文让我们身临其近时,我们会说这首诗真美;当我们读到某篇文章让我们长期心灵的桎梏、精神的困顿豁然开朗的.时候,我们会说这篇文章真美。我们在说美的时候,其实都只是一个随性的判断,靠得是自己粗疏的经验,至于为什么会觉得美,我们都没有意识进行仔细的考量。我们要欣赏、判断美,其实是不能离开理论支撑的。如果我们没有决定怎么才是美,就没有理由说这幅画比那幅画更美;如果我们没有明白艺术的本质,就没有理由说这件是艺术品,那件作品不是艺术品。只有当我们明白美的本质的时候,才能使欣赏和创造的过程得着更准确的力量。
对于读这本讲哲学,讲心理学的理论书籍,读起来非常费力。要来只是想了解一下,但是被作者严谨的治学态度,一以贯之的努力精神所感染,觉得不认真读完都是对不起作者所付出的努力和自己白白流失的青春。作者在整篇文章中,每论到一个观点,都列举了十几个思想流派的主流观点,然后自己不轻易的判断某种观点的对错,也不轻易接受某种观点。在以过自己认真思索、艰苦探索的之后,提出自己的见解。
因此,他在《谈美》中说到写此书时“要先看几十部书才敢下笔写一章”。这让我想起,他在这本书附录《作者自传》中提到的一件事情,在作者年近花甲的时候,还努力去学习俄文,并且可以达到读写的程度。前些年,我在某本书上看到北大王选在60多岁的时候,再去学计算机程序语言,并成功开发出汉字排版软件,打破了**对汉字排版领域多年的垄断,被誉为“当代毕昇”。在这里不是想说他们“老骥伏枥,志在千里”的故事,而是觉得我现在还很年轻,悲观、懒惰的情绪时常在缠绕着我。每当一看到《谈美书简》摆在我面前时,自不觉汗流夹背。
朱光潜《谈美书简》读书笔记10
一位耄耋之年的老人,在生命的黄昏还用如此细腻且深入浅出的文笔,将深奥的美学知识娓娓道来。对朱光潜老先生不由地由衷敬佩。
书中,老先生“对自己漫长美学生涯和美学思想”进行了系统的“回顾和整理”,也算是“给来信未复的朋友们”。在《谈人》里,老先生指出“原始人类对美的追求和所从事的艺术活动,如人体装饰、歌唱、音乐、舞蹈等,都直接源于原始民族休养生息的日常生活和经验,”美学,原来源于生活,贴近生活,真真切切地存在于我们身边。其实,冥思细想,美无处不在。*五千年文化博大精深,就有不少美的传承,比如唯美典雅的国画、笔酣墨饱的书法、国之精髓的京剧、名扬四海的瓷器工艺……
现代文化下人们更是发展了更多美学的分支。我们生活的现代城市格局,在追求现代感的同时融入大量自然元素,让自然在城市最大限度的得以保留加以体现,生态绿化的兴起,不正是体现人们在往更高层次的美的追求,在生活中时刻因外物美得到心理美,得到一种对于美感的满足从而欣喜,这也成为一种美。
文学美,就是人类先进思想的结晶,中间许多个性鲜明饱满的人物更是成为了美的**。《巴黎圣母院》中年轻貌美的吉卜赛女郎在危急时刻为卡西莫多挺身而出,给他救命之水。奇丑无比的敲钟人卡西莫多之后屡救吉卜赛女郎,为她报仇雪恨。你能说卡西莫多不美么?《老人与海》中穷困交加的圣地亚哥终日与海为伴,与比船还大的枪鱼奋战两昼夜,并击退啦鲨鱼无数次的攻击,虽然最后只拖回了一截白骨,但是我们能说他不是美的**吗?还有《弱种子也要发芽》里的老农,得知“我”的孩子听力受损,看到他把弱种子抛弃很难过后,“抹了一把眼角的泪水,以既夸张又慈爱的姿势,抓起了那些瘪种子”,让它们“妥妥帖帖地躺在了新鲜、肥沃的土壤里”,此刻的老农在震撼人心的感动中能说不美吗?
什么是美?如何学好美学?我们没有系统地学习过美学,就真的不懂美了么?难道一定要学好美学,才算懂美?朱光潜先生书中举例的杜甫诗句“癫狂柳絮随风舞,轻薄桃花逐水流”所反映的“移情作用”就明确告诉我们把自己的生命和情趣外射,达到物我合一,用心感受美的存在,就是最本质的美了。文学美,建筑美,都可归于此源。
生活中不是缺少美,而是缺少发现美的眼睛。罗丹的话已经为我们指引了通向美的真理的正确方向。
朱光潜《谈美书简》读书笔记10篇扩展阅读
朱光潜《谈美书简》读书笔记10篇(扩展1)
——朱光潜先生的《谈美》读书笔记5篇
朱光潜先生的《谈美》读书笔记1
这本毫无疑问不是我一贯爱的书型,但是一年中,总要有那么几本这些世界外的书。因为,它会给你开一扇与你原本生活截然不同的窗。
朱光潜的谈美,说的是什么是美、是艺术,怎么去欣赏、创造美。
最核心的思想我看来莫过于,艺术源于生活但却是无实际效用的,因为倘若有实际效用,那么接触的时候,想到的会是怎么用,而非单纯的欣赏怎么美。
书中有段话,我觉得说的很好:看倒影,看过去,看旁人的境遇,看稀奇的景物,都好比站在陆地上远看海雾,不受实际的切身的利害牵绊,能安闲自在地玩味目前美妙的景致。
这完全就能概括,为什么我们总觉得旅游的地方特别美,就像俗话说的,旅游就是从你活腻的地方到别人活腻的地方去。拼命想逃离,不是地方不美,只是,你到了这个地方你想到的是真实地生活、一系列的牵绊,无法去单纯欣赏这里的美。所要逃离的不过是现实罢了。
美,是没有意义的,朱光潜说意义大半都起于实用。唯有脱离了实用,你才能真正欣赏到纯粹的美,这也是为什么印象**画作你总是会看不懂,因为它强调的是线条、颜色、阴影,看轻内容。
这些感悟都让我对何谓艺术有了更深的体会。
记得当初朋友欧雯跟我说,她们系用来画陶瓷的颜料很多都是不适合食用的时候,我第一个反应是,那画出来的陶瓷碟有什么用。
她当时跟我说的是,用来欣赏的呀。
兜了一个圈,我开始慢慢理解了。要知道,我是个不择不扣的理想实用**者。
朱光潜说,当欣赏艺术的时候,人就能投入到绝无利害关系的世界里去。我在浮躁的生活中,要学会慢慢来,欣赏生活。
正如书中所说,车走太快,山边的美景也不过是囚牢。
书里面的文字很美,让我想起商学院之前爱文科的日子,中文真的很美,虽然我在拼命学外语,但看到像云破月来花弄影这样的好句的时候,还是忍不住反复玩味,云、破、月、来、花、弄、影,字字珠玑。
噢,对了,书中还有一句话,我很喜欢,风行水上,自然成纹。
其实我真的不知道这句话是什么意思,但我更希望自己把它解读成,一切顺其自然,会写成你心目中最理想的故事的。看“无用”的书籍,学着如何怡情养性。
在快节奏的生活,在奔忙的日子中,不失为一股清流。
朱光潜先生的《谈美》读书笔记2
已故的**大学教授朱光潜是我国著名的美学家,他从事美学研究六十多来著译宏丰,他的早期美学著作有《谈美》、《文艺心理学》《谈修养》,翻译的《歌德谈话录》、克罗齐的《美学》、柏拉图的《文艺对话集》,特别是翻译了黑格尔的110万字的美学巨著《美学》,在学术界赢得非常高的赞誉,他的学术生涯可以说是现代*美学发展的一个缩影,刊称为我国美学史的一代宗师。
朱光潜先生的美学思想的核心观点:美不在心,即不存在人的主观意识中,也不在物,即不存在客观事物中,它在心物的关系上。
朱先生在《谈美》一书中写到:一棵古松长在园里,任何人一看见它都认为它是一棵古松,古松在我们的脑海里已经形成了表象,古松的形象与古松的美,每个人在古松的形象见到到不同的美;也就是见出古松的不同形象。
一棵很美的古松长在园里,无论我们看见与否,它都是很美地在那个园子里,这种美并不存在我们的主观意识中;丑是美的残缺,那棵古松是美或是丑,审美标准都不是由古松自己决定的。
在此,朱先生把*传统的诗词歌赋,以较高的美学理解力做出刨析,给后人在阅读和赏析做出了杰出的艺术贡献。如:
奉帚*明金殿开,暂将团扇共徘徊。
玉颜不及寒鸦色,犹带昭阳日影来。
大家都知道这是失宠于汉成帝之后班睫妤书写的诗,通过对这首诗的分析,看到诗中的词句“奉帚”、“金殿”、“徘徊”、“玉颜”、“寒鸦、“日影”运用运用种种联想拟人式的想象唤起意象,并且采用《诗经》中比、兴手法,托物沿志,对情景人物刻画地入木三分使得读者受意非浅。
由此看来,他的对诗的独到理解,无不看出他有着深厚的*文化功底,把洗练和精粹都凝结在他的《诗论》中,并运**美学理论诠释*古典诗歌所达到了极高的境界。
朱光潜的人生美学认为没有脱离人生艺术的人生,应当以指向审美的存在提升品格。
在《谈美》一书的开场白中这样写到:“在这个危急存亡的年头,…… 我现在谈美,正因为时机实在太紧迫了”。给青年朋友的十二封信中写到:“要洗刷人心,一定要从怡情养性做起,要求人心净化,先要求人生美化”,做到免俗。也就是说:人要以最高的境界来提高修养、完善自我,去投入社会人生,从而达到服务社会和改造社会人生的最终目的。
读大师的《谈美》感触颇多,怨自己才疏学浅,只能潦此几笔了,但是,我还是奉您之嘱托,给等在天堂的您写这封回信吧。叩首!
朱光潜先生的《谈美》读书笔记3
本书作者朱光潜,字孟实。他90岁生涯的大部分都贡献给了*的美学事业,所以晚年的他被尊称为“美学老人”。
朱光潜的《谈美》写于1932年,由著名的开明书店出版。在此之前,他写过一本《给青年的十二封信》, 用书信的形式,漫谈文艺、美学、哲学、道德、**等问题,发人思考,指点迷津,在青年中引起很大反响,成为重印了30多次的畅销书。但这本书主要谈的是人生修养,还没有充分展示朱光潜的美学思想。于是,作为《给青年的十二封信》的姊妹篇,朱光潜以“给青年的第十三封信”为副标题,写作了这本《谈美》。
作者是怀着一种崇高的使命感和社会责任感来写这本不厚的小册子的,他用通俗易懂的方式和明白如话的语言把高深的美学问题讲得深入浅出,引人入胜,从而起到了净化读者心灵、提升一代青年精神境界的作用。而我,读了这本书后同样受益匪浅。
美是联想所产生的吗?作者借用牛希济的两句词“记得绿罗裙,处处怜芳草”,指出“许多通常被认为美感的经验其实并非美感”,而是“实际人的态度,在艺术本身以外求它的价值”。由萋萋芳草,联想到绿罗裙,也可以由一件古董,联想到金钱,并不是所有的联想,都是美的。纯粹的美,永远是一种“专注”,离开了专注,就已经离开了美了。
讲解了基本的美学观念之后,作者又进一步跟我们谈了艺术与游戏、艺术与想象、创造、情感等方面的问题。告诉我们艺术创造除了想象之外,还需要情感。
艺术创造除了想象之外,还需要情感。作者借司空图《诗品》中的一句话“超以象外,得其环中”指出:“诗人于想象之外又必有情感”,“情感是综合的要素,许多本来不相关的意象如果在情感上能调协,便可形成完整的有机体”。“意象”是朱光潜美学理论的重要概念,这里情感的作用十分突出。没有情感的统帅,想象也许会杂乱纷纭,有了情感的主导,则纲举目张,“意”与“象”合了。
朱自清先生说:“孟实先生引读者由艺术走入人生,又将人生纳入艺术之中。这种‘宏观的眼界和豁达的胸襟’,值得学者深思。文艺理论当有以观其会通,局于一方一隅,是不会有真知灼见的。”我认为确实如此,通过他的讲解,我真正认识了美,欣赏了美,发现了美。他的见解也的确“人性化”。
学术界有人指出:“朱光潜对美学的理解可以说是非常之深,他对**美学的介绍,在《谈美》中已经达到了一代大师的化境。”
我认为学习美学也好,学习艺术也好,关键不在能否掌握一两种技能,而是要看我们能否达到一种境界。若能够达到朱光潜先生所崇尚的“艺术化的人生”,恐怕可以说“今生无愧什么是美?这是一个很基本的问题,但毫无意外地,我们大多数人并不知道它的确切答案。其实从另一个方面来说,美并没有一个具体的标准,每个人对于美都有不同的定义。在《谈美书简》中,朱光潜先生给了我们一个答案,虽然这个答案不一定正确,但至少比毫无头绪要高明许多。许多人都认为,看过去舒服的就是美的,也许更深一层,会说心灵美也是一种美。但所有的这些都比较浅显的,而深入研究,又是望尘莫及的事了。通常我们对于美、美感、美的规律、美的范畴等等这些问题感到很深奥,也研究甚少,关于这些问题,朱光潜先生在此书中都一并回复了,而且回复的很详尽,对于思想,文学,方法,理论等等也有详细的陈述。对于美,我们看到的都是片面的,也可以说成的表面的,而看完这本书,我对于美则有了全新的看法,这也是读此书的收获吧。这本书是以信件的方式组成的,大多都是给读者的回信。(这一点,书中也有提到过)因此也就比较浅显易懂。在“知识链接”一栏中,编者提到了许多有关学术方面的美的知识。这让我们也提前了解了一些有关美的知识。虽然此书不是一本完整的美学著作,却也从一些很重要很关键的角度对美学的入门者的问题进行了解答,而且在很多方面都很有帮助。例如在《典型环境中的典型人物》一文中,作者比较具体、完整地讲解了在文学与戏剧作品中人物与环境的关系。他首先回顾了这一理论产生与发展的历史,进而指出,典型人物是能够体现社会历史发展的某些规律并且具有鲜明个性特点的人物形象,而典型环境则是典型人物所处的能够反映社会历史发展现状和趋势的具体情景和背景。典型人物应生活在典型环境中,而不能与环境相脱节。在这里,共性是通过个性来表现的,是在特殊中显示一般。文学之所以能在偶然性中见出必然性,是与再现“典型环境中的典型人物”这一理论分不开的。(此段有些摘录于原文)类似这样的例子还有许多,在此也就不一一详谈了。朱光潜先生信奉“三此**”,即此身,此时,此地:“此身应该做而且能够做的事,就得由此身担当起,不推委给旁人。”“此时应该做而且能够做的事,就该在此时做,不拖延到未来。”“此地(我的地位、我的环境)应该做而且能够做的事,就得在此地做,不推委到想象中另一地位去做。”这是朱光潜先生不尚空谈,脚踏实地的治学精神的体现。这很值得我们青少年去学习。一天的光阴转瞬即逝,而在这一天,我却度过了一个有意义的时光:我用一天的时间读完了13封信,而这13封信让我对美学有了一个基本的认识,这就是朱光潜先
生在83岁高龄写给青年的美学入门读物《谈美书简》。朱光潜先生是*现代美学的**人物,是开拓者和创新者,在美学领域是全国的权威,他主张美是主观性与客观性的**。他运用*****的观点来阐明了美和美感的规律、美范畴等一系列问题。在前言中,朱光潜告诉我们怎样学美学,但我认为更重要的在于,他对我们人生观的引导,如在前言中朱光潜写到“正路并不一定是一条**坦坦的直路,难免有些曲折和崎岖险阻,要绕一些弯,甚至难免误入歧途。哪个重要的科学实验一次就能成功呢?“失败者成功之母”。失败的教训一般比成功的经验更有益”……这些都呈现出一种积极的人生态度。通篇读来,其中具有开创性的观点比比皆是,现在简要归纳辑录如下:一人是审美的主体,人在改造客观世界时也改造了人本身,人在审美中具有最高的意义,美离不开人。二学习美学的方法应是:在应运用*****观点的同时,应多结合其他流派的观点考察美学。三艺术也是一种生产劳动,在审美中,人有意识的依据美的规律来创造美和发现美,所以,美也是一种生产劳动。四美是有阶级性的,但同时,美更本质的性质是人性,阶级性是人性中的一部分。这及时的更正了人们关于美的错误意识。五美与生理状态的内在联系,并认为美的文艺作品中应有思想性的渗透,但不是直接,而是间接从作品中表现出来。六现实**从客观出发,而浪漫**从主观出发,并据此认为我们不能容忍一个人因一点小过错而失败,从而产生出悲剧感,惊恐和哀怜是悲剧的情感基础,悲剧更为本质,好的喜剧作品中一定有悲剧性。 七崇高是我们由压抑而产生的,它是由恐惧转为振奋的,并在其中体会到一种自尊或愉悦。
崇高侧重于对立和冲突,而秀美侧重于*衡和**。 13封信,行云流水,读来浑然天成,却使我对美学有了第一次有了明晰的认识。每一封信都是那么亲切自然,知识在这种脉脉温情的态度中传达出来,其间没有美学中那种概念的堆砌,却使人们对美有了更深刻的认识。最美丽的人生一定有美的人生态度,所以,每个人多应读一读这13封信。
朱光潜先生的《谈美》读书笔记4
纵观朱光潜先生的《谈美》,大致分为了三个板块,其一是谈对美的欣赏,其二是讲美的创造,最后引申到了人生的艺术化,朱光潜先生本人也认为这是他自己最重要的理论。这本书看完后,对人生与艺术,自己与美有了自己的感悟。
书中开篇就解释了谈美的原因,“要求人心净化,先要求人生美化。”“人要有出世的精神才可以做入世的事业”,要做到“免俗”。而探讨现如今美的意义,或者是美学的意义,有一个很著名的观点就是现代美学的美育,美学可以把人的存在纳入形式表达的方法,审美的本质就在于让人的存在变得更加美好,意味着唯有通过审美教育才能真正获得对人生的的深层把握。以我所学,美育能够成为可能的基础,是因为艺术主要就是负担人的感性认知以及美感意识的水*的职责。而审美之所以如此重要,就在于通过艺术的审美教育,才能摆脱生命的慵常性,复苏被现实麻痹的感知,重新领悟到生命的真谛。而现在的社会是一个被技术**的时代,艺术成为了消费文化的一部分,在这种大潮里,唯有通过美育获得存在的感知,得到真正的本真。
在对美的欣赏上,首先是态度问题,对一颗古松不同的身份会有不同的感悟,而无论何种感悟都是带有个人的主观,这也体现出艺术与人生之间存在着紧密地联系。“极*常的知觉都带有几分创造性;极客观的东西之中都有几分主观的成分。”引出一个显而易见的道理“有审美的眼睛才能见到美”。仔细观察生活,确是如此,生活中极*常的东西都带有我们自己的主观意识,看到公寓旁边与楼齐高的参天大树,我们可能****,而当我用审美的观点去看待它,它又是那么的特别。站在树底下观之,只觉望不到树尖,树干上都是风霜的痕迹,凹凸不*,却带有一种古朴美;有次站在楼顶观之,别有一番景象,居高临下,它是那么的孤立,独树一帜,显示出傲然挺立之感,不畏寒冬,心中不觉对此敬佩。当时正值我背书背的很烦闷,忽觉树都能如此不畏环境的艰难,何况人呢。我想这就是审美给我带来的精神上的体验。
艺术与实际人生也是有距离的,而艺术与极端的写实**不相容。他说“美和实际人生有一个距离,要见出事物本身的美,须把他摆在适当的距离之外去看。”“艺术本来就是弥补人生和自然缺陷的。” 在许多文学作品中,本来现实的结局完满的,而改写成文学作品后,去掉了完美,给了他一个不完美的结局,这就在于这样使得悲剧更深入人心,能够起到更大的艺术效果。我们感悟艺术作品的时候,也要记得这个适当的距离,书中的古希腊和*旧戏的角色往往戴面具,穿高跟鞋,表演时的声调不像*常,这都体现距离。而这个是适当的距离,距离太远变成无法理解,而太近则不像是艺术。所以朱光潜先生说“一般人不能把切身的经验放在一种距离以外去看,所以情感尽管深刻,经验尽管丰富,终不能创造艺术。”要以主观的参与者退变为客观的观赏者。
朱光潜先生也谈到了几点对许多人对美感的误解。美学不是享乐**,而这个享乐指的是快感,我们欣赏一件作品时候的快感,愉悦之感,并不就是美感。“美感有普遍性,快感没有普遍性。”“美感与实用活动无关,而快感则起于实际要求的满足。”这个也解释了我心中的的疑问,对于一件事物的喜欢,并不能说明这个事物是美的,正如“实验美学”的人做的实验,问受验者喜欢哪些颜色、条纹,而艺术上部分之和并不等于全体,每个人都不尽相同,不能以大多数认为而断定它是美的。另一个误解是联想带来的就是美,“美感起于直觉,不带思考,联想却不免带有思考。”每个人的知识水*不尽相同,看到一件事物的联想也不会相同,看到一件事物的联想只是持有实际人的态度,在它的艺术本身以外去求它的价值,这显然是不对的。最后,考证和批评也不是对美的欣赏。当你看到一件文学作品,探析作者的一切,透析写作缘由,社会背景等,这可能会在无意之中磨灭了美。“遇到文艺作品如果始终持批评的态度,则我是我而作品是作品,我不能沉醉在作品里面,永远得不到真正的美感的经验。”或许对待作品,我们应该不掺加杂质,以本真之心去看待,这样也能更好地阅读作品,得到其中的真谛。
在美的创作上,朱光潜先生谈到“大人者不失其赤子之心”,艺术游戏说。“艺术的雏形就是游戏。游戏之中就含有创造和欣赏的心理活动。”我觉得这在一定程度上把艺术变得更加具体化。游戏和艺术一样是把欣赏的意象加以客观化,使它成为一个具体的情境。也是一种“想当然耳”的勾当,游戏也带有移情作作用,把死板的宇宙看成活跃的生灵,是在现实世界之外另造一个理想世界来安慰情感。这可能是受到席勒认为人有一种游戏冲动,这是以美为对象的艺术创造冲动。但是有浓厚的“乌托邦”色彩。同时,也使艺术成为一种社会****的工具,承担了太多的“说教”功能和“神圣”色彩,弱化了游戏的实践性、对话性和非功利性等。总之,我认为在美的创作上,朱光潜先生提到的“读书破万卷,下笔如有神”说的十分正确。以前看过一段话说,读书有什么用,还不如拿读书的钱出去旅行,古有“读万卷书,不如行万里路”。接着就有人回复说,你不读书,即使行了万里路也只是一个邮差。说的不无道理,心中没有知识的储备,更不会说对美有任何感悟。现在的我们,应该打好基础,多充实自己,不管是知识上,还是能力上。正如书中所说,灵感是突如其来,出于作者自己意料之外的,是不由自主的、突如其来的。“不过灵感的培养正不必限于读书。人只要留心,处处都是学问。”这就要求我们要注意观察生活,也就是对美的欣赏上说的有一双审美的眼睛。要留心观察生活,对生活中的事物要有自己的见解和思考。
最后朱光潜先生说道人生的艺术化。以上见解可观之艺术与人生的关系紧密,朱光潜先生也认为“人生本来就是一种较广义的艺术。每个人的生命史就是他自己的作品。”而他也把人生分为了实际人生和整个人生。实际人生只是整个人生中的一部分,艺术与人生都有一种完整性,都是以“情趣”为本体的生命精神的显现。朱光潜先生说,艺术的生活就是本色的生活,我想这里的本色是指的有趣的,有源头涉水的生活,而不是机械的、干枯的生活,而是显露人生真性情的生活。
艺术和生活的创造之中都含有欣赏,朱光潜先生说:“善于生活者则彻底认真,不让一尘一芥妨碍整个生命的**。”而我们对于生活也要怀有一定的严肃性,正如前文所说,在持出世精神与做入世事业之间、在超脱人生与淑世**之间的圆融。或者说,严肃与豁达尖山的艺术与人生态度,还喻示着道德精神与审美**的同一性。我觉得这种豁达的精神很值得学习,在生活中,我们可能会过度的在乎我们自己的得失,斤斤计较,殊不知这是在丧失生活的乐趣。
而朱光潜先生说的阿尔卑斯山谷公路边的标牌:“慢慢走,欣赏啊!”许多人在这车水马龙的世界里生活,恰如乘坐在疾驰而过的汽车上,“慢慢走”有的人认为是以时间换空间,把实用的人暂时变成审美的人,把路旁的风景变成审美的对象。“欣赏啊”,就是完成一次完满的审美经验,体验到真正的“美”。现实世界名缰利锁,人生很难**超脱,而我们可以怀着美感的纯粹意象的世界,看淡我们**得失和利害关系,做一个纯粹的本真的人,即使在现实生活中难以做到,我们也可以在自己心中找到自己的*衡点。从心中开始做一个本真的人,找到我们自己人生与艺术的联系。
朱光潜先生的《谈美》读书笔记5
最经,我阅读了朱光潜先生的《谈美》一书,颇受启发,收获良多,读朱光潜《谈美》有感。这本书为我打开了美学这一陌生学科的大门,让我第一次真正领略到美学其独特的知识魅力。最难能可贵的是,朱光潜先生能够用朴实无华、浅显易懂的语言,将原本深奥枯燥的理论分析地如此客观、如此透彻、如此深入浅出,让我们这些美学的门外汉也能读懂作者所要表达的思想和观点。读完这本书,头脑里不是堆积如山的理论包袱,而是一种通透的、简单的、贴近于生活的印象,这也就使我在阅读后收获了更多的知识,以下就是我对于这本书内容的一些总结和概括,以及我在阅读后的所想所感。
《谈美》是朱光潜先生于1932年以书信形式为青年所写的一本美学入门书。本书共分为十五个章节,章节间的思路连贯,层层深入,其间的论述有理有据,语言深入浅出。本书主要探讨了关于美学的一些基本问题,例如:美是什么,美从哪里来,美具有什么特点,美与自然的关系,美与实际人生的距离 这些都是最基础的美学问题,同时也是最关键的问题,朱光潜用客观、精确、凝练的语言对其加以分析和论述,使读者初步了解和认识美学,正如朱自清在《<谈美>序》中所说:“引读者由艺术走入人生,又将人生纳入艺术之中”。
书的第一章到第三章重点论述了美感是什么,美感从哪里来的问题。在第一章中,作者以一颗古松为例,将人们实用的、科学的、美感的三种态度加以比较和区别。实用的态度以善为最高目的,***偏在事物对于人的利害,心理活动偏重意志;科学的态度以真为最高目的,***偏在事物间的互相关系,心理活动偏重抽象的思考;美感的态度以美为最高目的,***专在事物本身的形象,心理活动偏重直觉。所以,美感经验就是形象的直觉,美就是事物呈现形象于直觉时的特质。在第二章中,作者强调要以一种“无所为而为”的精神去欣赏事物本身的形象,美和实际人生有一定的距离,要见出事物本身的美,须把它摆在适当的距离之外去看。
长时间不曾读书,更不曾这么认真的读书。《文艺心理学》(复旦大学出版学出版)又名《谈美》,是朱光潜先生一部谈美学的论著。朱光潜先生在美学界的造诣这里无需过多赘述,他是我国研究美学的始祖,一代美学大师。通读完后,首先的感觉是朱先生知识的渊博,旁征博引,学贯中西。在他的书中,古今中外的文献引用得极多,而且所引用的英法德等国关于美的论述都是他最早翻译过来的。其实粗读一篇,我真没有弄明白到底什么是美。虽然他通篇都在介绍什么是美,从心理学角度、从哲学角度、从自然科学角度去研究、论证美的本质意义。但是我读的还是一头雾水,因为朱先生的思想是那么的深邃;眼光是那么犀利;观点是那么独到,读后感《读朱光潜《谈美》有感》。都说读书就是读者和作者心与心的交流,我只觉得朱先生穿着一身长马褂,在某个黄昏的清风中,向我娓娓道来,像一切得道智者一样,他持才并不傲物,从容淡泊,虚怀若谷。对我而言,朱先生只能用“高山仰止,景行行止”来形容了。
到底什么是美? 为什么美?朱光潜先生并没有给出明确的定义。对于一个严谨的科学研究者或者说是理论研究者,简单草率地定义某种事物,总不免会把读者引入歧途甚至会怡笑大方。伟人如柏拉图也曾犯下把人定义成没有羽毛动物的错误,留下了千古笑柄。美不完全是事物的属性,不能科学定性地定义。譬如我们说水,这是可以严格定义的,凡是由2个氢原子和1个氧原子化合而成的物质就是水,这个不会因为不同人有不同看法而改变。然而我们很多人对美的定义其实都是成为美的条件,我们说脚长的女人比脚短的女人要美,对称的比散乱的要美,但这都是成为美的条件,但具备这些条件的不一定就是美。正如空气含有水分是雨的条件,但空气中的水分却不是雨。因此有人问圣·奥古斯丁:“什么是时间?”,他回答:“你不问我,我本来很清楚地知道他是什么,你问我,我倒觉得茫然了”。 美不能定义,又不是事物固有的属性,那就没有研究价值了吗?朱先生告诉我们,美其实在某种程度上也是事物属性,当我们见到美的事物时,大多数人还是会觉得那是美的。但是研究判别美,不仅要在物本身着眼,同时还要着重观赏者在所观赏物中见到的价值去研究。通俗一点讲,就是美不仅在物,而且在心,在物为刺激,在心为感受。世界上没有天生自在,俯首即拾的美,凡是美都要经过心灵的创造,所以美学研究的理论,不仅要讲艺术,而且要讲心理。作者用了十七章的篇幅在讲美,我才疏学浅,读了多遍亦只是管中窥豹,不能全面真正理解作者所阐述的理论。刚看到这本书的时候,我和大多数人一样都有一个疑问,自已认为美就是美,了解那么多有意义吗?
为什么要研究美? 现实生活中我们每个人都攀登过山,游玩过水,欣赏过画,背颂过诗文,当我们发现某处景色让我们心情愉悦时,我们会说,这里真美;当我们读到某处诗文让我们身临其近时,我们会说这首诗真美;当我们读到某篇文章让我们长期心灵的桎梏、精神的困顿豁然开朗的时候,我们会说这篇文章真美。我们在说美的时候,其实都只是一个随性的判断,靠得是自己粗疏的经验,至于为什么会觉得美,我们都没有意识进行仔细的考量。我们要欣赏、判断美,其实是不能离开理论支撑的。如果我们没有决定怎么才是美,就没有理由说这幅画比那幅画更美;如果我们没有明白艺术的本质,就没有理由说这件是艺术品,那件作品不是艺术品。只有当我们明白美的本质的时候,才能使欣赏和创造的过程得着更准确的力量(朱自清语)。对于读这本讲哲学,讲心理学的理论书籍,读起来非常费力。要来只是想了解一下,但是被作者严谨的治学态度,一以贯之的努力精神所感染,觉得不认真读完都是对不起作者所付出的努力和自己白白流失的青春。作者在整篇文章中,每论到一个观点,都列举了十几个思想流派的主流观点,然后自己不轻易的判断某种观点的对错,也不轻易接受某种观点。在以过自己认真思索、艰苦探索的之后,提出自己的见解。因此,他在《谈美》中说到写此书时“要先看几十部书才敢下笔写一章”。这让我想起,他在这本书附录《作者自传》中提到的一件事情,在作者年近花甲的时候,还努力去学习俄文,并且可以达到读写的程度。前些年,我在某本书上看到北大王选在60多岁的时候,再去学计算机程序语言,并成功开发出汉字排版软件,打破了**对汉字排版领域多年的垄断,被誉为“当代毕昇”。在这里不是想说他们“老骥伏枥,志在千里”的故事,而是觉得我现在还很年轻,悲观、懒惰的情绪时常在缠绕着我。
朱光潜《谈美书简》读书笔记10篇(扩展2)
——朱光潜《谈美》的读书笔记3篇
朱光潜《谈美》的读书笔记1
什么是美?这是一个很基本的问题,但毫无意外地,我们大多数人并不知道它的确切答案。其实从另一个方面来说,美并没有一个具体的标准,每个人对于美都有不同的定义。在《谈美书简》中,朱光潜先生给了我们一个答案,虽然这个答案不一定正确,但至少比毫无头绪要高明许多。
许多人都认为,看过去舒服的就是美的,也许更深一层,会说心灵美也是一种美。但所有的这些都比较浅显的,而深入研究,又是望尘莫及的事了。通常我们对于美、美感、美的规律、美的范畴等等这些问题感到很深奥,也研究甚少,关于这些问题,朱光潜先生在此书中都一并回复了,而且回复的很详尽,对于思想,文学,方法,理论等等也有详细的陈述。对于美,我们看到的都是片面的,也可以说成的表面的,而看完这本书,我对于美则有了全新的看法,这也是读此书的收获吧。
这本书是以信件的方式组成的,大多都是给读者的回信。(这一点,书中也有提到过)因此也就比较浅显易懂。在“知识链接”一栏中,编者提到了许多有关学术方面的美的知识。这让我们也提前了解了一些有关美的知识。
虽然此书不是一本完整的美学著作,却也从一些很重要很关键的角度对美学的入门者的问题进行了解答,而且在很多方面都很有帮助。
例如在《典型环境中的典型人物》一文中,作者比较具体、完整地讲解了在文学与戏剧作品中人物与环境的关系。他首先回顾了这一理论产生与发展的历史,进而指出,典型人物是能够体现社会历史发展的某些规律并且具有鲜明个性特点的人物形象,而典型环境则是典型人物所处的能够反映社会历史发展现状和趋势的具体情景和背景。典型人物应生活在典型环境中,而不能与环境相脱节。在这里,共性是通过个性来表现的,是在特殊中显示一般。文学之所以能在偶然性中见出必然性,是与再现“典型环境中的典型人物”这一理论分不开的。(此段有些摘录于原文)
类似这样的例子还有许多,在此也就不一一详谈了。
朱光潜先生信奉“三此**”,即此身,此时,此地:“此身应该做而且能够做的事,就得由此身担当起,不推委给旁人。”“此时应该做而且能够做的事,就该在此时做,不拖延到未来。”“此地(我的地位、我的环境)应该做而且能够做的事,就得在此地做,不推委到想象中另一地位去做。”这是朱光潜先生不尚空谈,脚踏实地的治学精神的体现。这很值得我们青少年去学习。
朱光潜《谈美》的读书笔记2
“人生莫要大汗淋漓埋头向前,也当时不时停下来,慢慢走,欣赏路两边的风景”,因桥梁而入美学,朱光潜老先生的《谈美》,当为小玄子的美学第一课。
01、缘起
最先知道朱光潜作为美学家是在高中教室的图书角,教语文的班**是美学硕士,在教室的窗台上开辟了图书角,放置了中外文学(美学)书籍,其中就有朱的著作(具体是哪一本记不清了)。最先注意到《谈美》这本书,也是因了朱光潜先生的名号,这本书是先生于1932年(时年35岁,算是人生早期阶段)著作的一部谈论美学的书籍,书不算厚,197页,其中讲述了*的古典美,又引用**美学家的观点谈鉴赏美,读来不像一般哲学书那般苦涩难懂,也不像一般美学书张口闭口引经据典,非要有厚实的文学基础才能读得顺心遂意,《谈美》这本书就像作者在序言中所说,以一种跟小辈人谈话的方式进行,作者说在著书前不需动辄读十几本参考书,就以最*常的语言和聊天的方式来听谈论生活中的美,文学中的美,让从未接触过理论美学的工科生深深沉浸其中,惊喜于先生的文笔和当中所蕴含的思想。
02、转合
拿到这本书,打开目录便被序列一到十五的标题惊艳到了,***谈论对审美三种不同态度篇朴实如“我们对于一颗古松的三种态度”,也有谈论美感和联想且自带意境的诗句“记得绿罗裙,处处怜芳草”,也有谈论写实**和理想**关系篇目的“依样画葫芦”。不同于理科课本中纯属解释概念的标题,用朴实命题、古诗、经典名句、俗语做标题,参差不齐的表述形式,视觉上本身就形成了一种美感,借他语以言己意,又是一美!首先要想用他人之语表己之思想,你得理解到他人之语的深刻含义,他人通过这段语言想表达出自己什么样的思想,之后你要用自己的情感去理解他人的思想,再将其融为一体并以一种大众认可为美的形式表现出来,这不就是最简单的一种美的形成过程吗?(对标题美的初步看法)
对于书中的观点我不是都认可,只针对其中感兴趣的几点,谈论一下我的看法,简单做一下笔记。第一篇谈论对美三种态度的末尾的一句话,让我很受触动,写的很有文采,朱自清作的序中也曾提到这句,下面我们简单来看看这句话。
“悠悠的过去只是一片漆黑的天空,我们所以还能认识出来这漆黑的天空者,全赖思想家和艺术家所散步的'几点星光。朋友,让我们珍重这几点星光!让我们也努力散步几点星光去照耀和那过去一般漆黑的未来。”
这里看起来很有意思,漆黑的天空代指世间一切未知的混沌状态,把思想家对于世界的看法和艺术家基于世界现实所创造的艺术看做几点星光,比喻很是贴切,也说明了我们对世界的认知是小荷才露尖尖角,是那一点点,后面又说珍惜这些星光,自己也要去散布星光,这种发掘未知的贡献精神是我们应当去学习的。但这结论未免又有些绝对,全赖思想家和艺术家概念是否有些缩小化,有以偏概全的嫌疑,或许一切可欣赏可表达者皆可称为思想家和艺术家。
我们对美的追求古已有之。原始先民用于做饭的炊具,其上面的花纹令今人都叹为观止。炊具满足了为人的基本生存需求提供了辅助,但花纹却不是必须的,没有花纹也并不影响人的生存,是否从这一表现中看到原始人对美的追求?按照书中的观点,这种美是最基础的物质美,是不需要系列复杂的情感和方法。如果从另一个角度想,先民们看到了美丽的花纹并将其内化使心情愉悦,产生了对这些饰有花纹陶罐的喜欢,由物之美上升到内心情感的愉悦喜爱,或许这已经不是最基础的物质美了吧。
接着先生在第一章谈论对一棵古松的三种态度,其实是人对美的三种态度,古松是美的载体,单纯的谈美未免让人觉得空泛,古松给了美以具体的表现形式,美又是古松的表观显现,就像我们的这门课,我们要学结构美学,而桥梁就是载体,我们要在不同的桥梁中去欣赏结构美学。回到文中,作者以木商、植物学家和画家三种人来表述人在不同状况下对这棵古松的三种态度,用以表现美的实用性、科学性和艺术性,而不能单纯理解为这三种人只能按照自己的职业思维去看这颗古松,如果非要这般解释也未免太过于武断。三种人划分只是以他们的职业为依据,但除去职业外,他们都是一个个体,可以欣赏美的个体,木商在思考这颗古松的价值时未必不会考虑到古松的苍劲挺拔,未必不知道树的根枝丫等结构,只是每个人由于自己的生活经验,在看到一个事物发表意见时最容易从自己生活中得到的先验知识出发。如果给定美的话题,让上述的三种人谈论这颗古松,三人的看法未必可见高低。这里我想说,每个人都有欣赏美的眼睛,只是生活的经验让人容易从接近当前生活状态的角度出发,而艺术家恰好是从事艺术审美的工作,他的出发点较之于他人距离美便近了很多。
第一章篇末,先生提到“许多轰轰烈烈的英雄和每人都过去了,许多轰轰烈烈的成功和失败也都过去了,只有艺术作品真正是不朽的。”有列举曹孟德和秦始皇的例子加以说明,其实我是不大认同他的观点的。曹明德和秦始皇是历史上真人真事,是人便会有生死,是事便会有始末,历史的流转和朝代的更迭使之然。而先生所说的艺术作品则是他们形象和精神的载体,他们肉体早已化为碳水尽归自然,而他们的事迹流传千古给无数人以激励和警醒,当朝子民的记载让他们的事迹得以让千百年后的我们知晓,感受曹孟德舳舻千里、旌旗蔽空的豪迈气势,感受秦始皇一统六国、始制文字、**度量衡时的雄心与壮志。此般情景因被人记录而成为“艺术”,我们今人看到再根据自己的经验想象那年那人那景,借彼之言抒自己的情感,我们便感到了美。所以我们能单纯把此段要描述的艺术和历史割裂**看吗?答案显然是否定的。
**者迷旁观者清——论述了“艺术是主观的,都是作者情感的流露,但是它一定要经过几分客观化”,以此说明艺术和实际人生是有距离的。对于前面的观点我从未涉足,但对后面艺术和人生的距离有几点简单的看法。拿生活中的例子来看,人们经常会喜欢影视作品中扮演“好人”的演员,而讨厌其中扮演坏人的演员,这个现象带有一点移情作用,演员刻画人物形象很到位,因此我们便将对角色的情感带入到演员本身,像是艺术对生活的外延。但也有**报道观众因对扮演坏人角色深恶痛疾而上升到对演员的人身攻击,这种行为本身已经超出了艺术的范畴,艺术的美已经被生活的带入所破坏。演员刻画坏人的形象深入骨髓,说明演员的表演功力深厚,我们欣赏“坏人”的表现来感受表演的魅力,这是一种美的体验,但当我们把艺术现实生活化后,艺术与现实不再有距离,艺术便被现实生活的基本生存需求和不受控的情感赶出了美的世界。
03、终
读朱先生的《谈美》,给我最大的感受是惊奇。在枯燥的理工科学习中偶尔体验一下文人墨客的情怀,感受诗词歌赋中的风花雪月,以第三视觉去看哲人的争辩,岂不妙哉?记得有一章中写艺术的移情于景,写到王昌龄的《长信怨》,写到“奉帚*明金殿开,暂将团扇共徘徊”,写班婕妤团扇之用意,写王昌龄又用团扇之意,读完这一章有一种茅塞顿开的感觉,初中语文老师费九牛二虎之力给你讲象征讲抽象,撑着脑袋听到头晕晕也没能明白什么是象征什么是抽象,读完这段文字,便有“原来是这个样子啊”的感叹!不求一本书能读懂美学,看透美的哲理,但希望能以这本书为起点,拓展自己的阅读范围和眼界,能够在现实生活中体验书中所写美学的魅力,让生活变得不再仅仅是柴米油盐那么简单,即使是仅仅有柴米油盐也可以有陶渊明“采菊东篱下,悠然见南山”般的深度,应书中最后一章先生的提议,人生莫要大汗淋漓埋头向前,也当时不时停下来,慢慢走,欣赏路两边的风景!
朱光潜《谈美》的读书笔记3
最近又重读了美学大师朱光潜的《谈美》一书,跟上次读起来感觉又有很大不同,收获良多。这或许正是经典书籍的魅力所在:除了百看不厌,还能让人每次都有新的感悟。
《谈美》开篇举例了三种人对一颗古松的不同态度。一位木材商,一位植物学家,一位画家,三人同时来看一颗古松。三人同时都“知觉”到这一棵古松,可是三人所知觉到的却是三种不同的东西。木材商难掩商人习性,只用木材价值来审视古松;植物学家知觉的只是一棵叶为针状,果为球状,四季常春的显花植物;画家却只管审美,他所知觉到的只是一棵苍翠劲拔的古树。
同样的一棵古松,它的形象随观者的性格和情趣而而变化。各人所见到的形象都是个人自己性格和情趣的观照。古松的形象一半是天生的,一半也是人为的!极*常的知觉都带有几分创造性,极客观的东西之中都有几分主观的成分。
美也是如此,即便是极客观存在的美,也要通过审美(主观)的眼睛才能见到。我不由得想起那句怀才不遇的老话,千里马常有而伯乐不常有。再优秀的设计作品也得同样有眼光的业主才能欣赏和认可呀(笑)。
说回上面的三种观点,作者认为分别**了实用性、科学性和美感性三种截然不同的人生态度。
先说实用的态度,做人首先要维持生活,既要生活,就要讲究如何利用环境。“环境”对于生活有些有益,有些有害,有些不关痛痒。于是我们对于他们就有了爱恶的情感。这就是实用的态度。实用的态度起于实用的知觉,实用的知觉起于经验。
科学的态度则不然。它纯粹是客观的,理论的。就是把自己的成见和情感完全丢开,专以“无所为而为”的精神去探索真理。科学的态度源于公式、数据和理论。
美感经验就是形象的直觉,美就是事物呈现形象于直觉时的特质。所以美感的态度,是***专在事物本身的形象,也就是偏重直觉的心理活动。
我突然联想到,书中所说的三种态度这不就是设计装修中的三方参与者的心理活动嘛。我们不妨将这三种态度代入装修工作中来看。
实用性——业主方。
什么是实用性呢,具体来说,比如卫生间地砖是否防滑(安全第一)、厨房墙地砖好不好打理(卫生第二)、开关位置合不合理(再也不用石头剪刀布老虎棒子鸡决定谁关灯)、不同位置灯光明暗设置得好不好(起夜开灯晃瞎眼)、门窗开扇方向合不合适、橱柜高度会不会影响操作(不下厨理由±1)等等。
综合整个装修周期来讲,绝大部分的业主最为关心的还是装修实不实用,毕竟他们才是房屋的最终的使用者,实用与否决定了他们对装修工作的盖棺定论。
科学性——项目经理。
天马行空的设计方案如何实现(还能这样做?!不要钱的吗),装修成本和装修质量该怎么权衡(缺钱or缺德),施工工艺的选择与改进等等等等,事无巨细都需要科学、严谨的态度才能做出最为合理的决策。
美感性——***。
优秀的***往往都有天马行空的想象力和善于发现美的眼睛,他们专注于建筑物本身的形象,往往会先大胆构思一种或几种最能展现建筑美的方案,自我欣赏不能自拔(大雾),再结合业主的要求,从实用性和科学性出发,在满足实用功能和可行性的基础上追求整体居家环境的美观性,从而将家居生活感化,达到功能性、科学性和美感性的****。(毕竟连**是妥协的艺术,更何况装修设计呢)
我们常说艺术(或者美)源于生活而高于生活,可见只有保持适当的距离和高度,才能产生美感,而在美感方面保持洞察力正是***的基本素养。
所以,在满足功能和成本要求的情况下,希望业主朋友能够更多地采纳***的意见,向光潜先生所说的“不令人俗”的境界再靠近一些。
朱光潜《谈美书简》读书笔记10篇(扩展3)
——朱光潜《谈美书简》的读书笔记
朱光潜《谈美书简》的读书笔记1
这是朱光潜先生在83岁高龄写给青年的美学入门读物《谈美书简》。朱光潜先生是**现代美学的**人物,是开拓者和创新者,在美学领域是全国的权威,他主张美是主观性与客观性的**。他运用*****的观点来阐明了美和美感的规律、美范畴等一系列问题。
在前言中,朱光潜告诉我们怎样学美学,但我认为更重要的在于,他对我们人生观的引导,如在前言中朱光潜写到“正路并不一定是一条**坦坦的直路,难免有些曲折和崎岖险阻,要绕一些弯,甚至难免误入歧途。哪个重要的科学实验一次就能成功呢?“失败者成功之母”。失败的教训一般比成功的经验更有益”……这些都呈现出一种积极的人生态度。
什么是美?这是一个很基本的问题,但毫无意外地,我们大多数人并不知道它的确切答案。其实从另一个方面来说,美并没有一个具体的标准,每个人对于美都有不同的定义。在《谈美书简》中,朱光潜先生给了我们一个答案,虽然这个答案不一定正确,但至少比毫无头绪要高明许多。
许多人都认为,看过去舒服的就是美的,也许更深一层,会说心灵美也是一种美。但所有的这些都比较浅显的,而深入研究,又是望尘莫及的事了。通常我们对于美、美感、美的规律、美的范畴等等这些问题感到很深奥,也研究甚少,关于这些问题,朱光潜先生在此书中都一并回复了,而且回复的很详尽,对于思想,文学,方法,理论等等也有详细的陈述。对于美,我们看到的都是片面的,也可以说是表面的,而看完这本书,我对于美则有了全新的看法,这也是读此书的收获吧。
朱光潜《谈美书简》读书笔记10篇(扩展4)
——《数学之美》读书笔记10篇
《数学之美》读书笔记1
很多人都觉得,数学是一个太高深、太理论的学科,不接近生活,对我们大多数人来说*时也根本用不到,所以没必要去理解数学。但事情真的是这样吗?
其实不然,数学一直渗透在我们生活的各个方面,尤其是在今天这个信息时代,很多简单朴素的数学思想,能发挥一般人很难想象的巨大作用。比如,计算机处理自然语言,用到的最重要工具是统计学的思想;计算机对**内容的分类,依靠的是数学里的余弦定理;而电子电路的基本逻辑,则来源于仅有0和1两个数字的布尔代数。
在《数学之美》里,吴军用自己在工作中使用数学的亲身经历,为我们展现了数学的重要性,以及他对数学之美的理解。吴军是“得到”App专栏《吴军的谷歌方法论》的主理人。曾先后供职于谷歌和腾讯,是著名的.自然语言处理专家和搜索专家。同时,他还是位畅销书作家,除了这本《数学之美》以外,还写过《文明之光》《智能时代》《浪潮之巅》等多本畅销书。
《数学之美》读书笔记2
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道----解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。
第二章《自然语言处理----从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能****的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法---基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型,就可以解决好多机器学习的问题,训练中会涉及到一些经典的算法(维特比算法等)。关于这个模型,没有实际实现过,所以感觉好陌生,只是知道了些概率论讲过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我**你”。贾里克尼教授一生专注学习,最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。
在这章中对于少年时的教育,以下几点值得借鉴:
1、少年时期其实没有必要花那么多时间读书,他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。
2、中学时花大量时间学会的内容,在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。
3、学习(和教育)是一个人一辈子的过程。
4、书本的'内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美----布尔代数和搜索引擎的索引》:布尔是19世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1,为了适应索引访问的速度、附加的信息、更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运算。牛顿的一句话“(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的”。做好搜索,最基本的要求是每天分析10-20个不好的搜索结果,积累一段时间才有感觉。有时候,学习、处理问题,可以从不好的方面入手,效果可能更好。
第九章《图论和网络爬虫》:图的遍历分为“广度优先搜索(Breadth-FirstSearch,简称BFS)”和“深度优先搜索(Depth-FirstSearch,简称DFS)。互联网上有几百亿的网页,需要大量的服务器用来下载网页,需要协调这些服务器的任务,这就是网络设计和程序设计的艺术了。另外对于简单的网页,没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过(如果记录每个网页的url,数量太多,这里可以用后面提到的信息指纹,只需要一个很多位的数字即可),避免重复下载。另外,在图论出现的很长一段时间里,实际需求的图只有几千个节点,那时图的遍历很简单,人们都没有怎么专门研究这个问题,随着互联网的出现,图的遍历一下子有了用武之地,很多数学方法就是这样,看上去没有什么用途,等到具体的应用出来了一下子开始派上大用场了,这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单,但里面的每个东西都可能是一个复杂的东西,需要很好的设计。
第十章《PageRank----Google的**表决式网页排名技术》:搜索返回了成千上万条结果,如何为搜索结果排名?这取决与两组信息:关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量,该算法的思想是如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难,可是当时只有佩奇和布林想到了,为什么呢?
第十一章《如何确定网页和查询的相关性》:构建一个搜索引擎的四个方面:如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF,TF衡量一个词在一个网页中的权重,即词频。IDF衡量一个词本身的权重,对主题的预测能力。一个查询和该网页的相关性公式由词频的简单求和变成了加权求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN。看似复杂的搜索引擎,里面的原理竟是这么简单!
第十二章《地图和本地搜索的最基本技术——有限状态机和动态规划》:地址的解析依靠有限状态机,当用户输入的地址不太标准或有错别字时,希望进行模糊匹配,提出了一种基于概率的有限状态机。通用的有限状态机的程序不是很好写,要求很高,建议直接采用开源的代码。图论中的动态规划问题可以用来解决两点间的最短路径问题,可以将一个“寻找全程最短路线”的问题,分解成一个个寻找局部最短路线的小问题。有限状态机和动态规划问题需要看相关的算法讲解,才能深入理解,目前对其并未完全理解。
第十三章《GoogleAK-47的设计者——阿米特·辛格博士》:辛格坚持选择简单方案的一个原因是容易解释每一个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。辛格要求对于搜索质量的改进方法都要能说清楚理由,说不清楚理由的改进即使看上去有效也不会采用,因为这样将来可能是个隐患。辛格非常鼓励年轻人要不怕失败,大胆尝试。遵循简单的哲学。
第十四章《余弦定理和**的分类》:将**根据词的TF-IDF值组成**的特征向量,然后根据向量之间的余弦距离衡量两个特征之间的相似度,将**自动聚类。另外根据词的不同位置,权重应该不同,比如标题的词权重明显应该大点。大数据量的余弦计算也要考虑很多简化算法。
第十五章《矩阵运算和文本处理中的两个分类问题》:将大量的文本表示成文本和词汇的矩阵,然后对该矩阵进行奇异值SVD分解,可以得到隐含在其中的一些信息。计算余弦相似度的一次迭代时间和奇异值分解的时间复杂度在一个数量级,但计算余弦相似度需要多次迭代。另外,奇异值分解的一个问题是存储量大,而余弦定理的聚类则不需要。奇异值分解得到的结果略显粗糙,实际工作中一般先进行奇异值分解得到粗分类结果,在利用余弦计算得到比较精确地结果。我觉得这章讲的SVD有些地方不是很清楚,已向吴军老师请教了,等待回信。
第十六章《信息指纹及其应用》:信息指纹可以作为信息的唯一标识。有很多信息指纹的产生方法,互联网加密要使用基于加密的伪随机数产生器,常用的算法有MD5或者SHA-1等标准。信息指纹可以用来判定集合相同或基本相同。YouTobe就用信息指纹来反盗版。128位的指纹,1.8*10^19次才可能重复一次,所以重复的可能性几乎为0。判定集合是否相同,从简单的逐个比对到利用信息指纹,复杂度降低了很多很多。启发我们有时候要用变通的思想来解决问题。
第十七章《由电视剧《**》所想到的——谈谈密码学的数学原理》:RSA加密算法,有两个完全不同的钥匙,一个用于加密,一个用于解密。该算法里面蕴含着简单但不好理解的数学思想。信息论在密码设计中的应用:当密码之间分布均匀并且统计**时,提供的信息最少。均匀分布使得敌人无从统计,而统计**能保证敌人即使知道了加密算法,也不能破译另一段密码。
第十八章《闪光的不一定是金子——谈谈搜索引擎反作弊问题》:把搜索反作弊看成是通信模型,作弊当做是加入的噪声,解决噪声的方法:从信息源出发,增强排序算法的抗干扰能力;过滤掉噪声,还原信息。只要噪声不是完全随机并且前后有相关性,就可以检测到并消除。作弊者的方法不可能是随机的,且不可能一天换一种方法,及作弊是时间相关的。因此在搜集一段时间的作弊信息后,就可以将作弊者抓出来,还原原有的排名。一般作弊都是针对市场份额较大的搜索引擎做的,因此,一个小的搜索引擎作弊少,并不一定是它的反作弊技术好,而是到它那里作弊的人少。
第十九章《谈谈数学模型的重要性》:早期的行星运行模型用大圆套小圆的方法,精确地计算出了所有行星运行的轨迹。但其实模型就是简单的椭圆而已。一个正确的数学模型应该在形式上是简单的;一个正确的模型可能开始还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;大量准备的数据对研发很重要;正确的模型可能受到噪声干扰,而显得不准确,这是不应该用一种凑合的修正方法来弥补它,要找到噪声的根源,这也许能通往重大的发现。
第二十章《不要把鸡蛋放在一个篮子里——谈谈最大熵模型》:对一个随机事件预测时,当各种情况概率相等时,信息熵达到最大,不确定性最大,预测的风险最小。最大熵模型的训练非常复杂,需要时查看资料做进一步的理解。
第二十一章《拼音输入法的数学原理》:输入法经历了以自然音节编码,到偏旁笔画拆字输入,再回归自然音节输入的过程。任何事物的发展,螺旋式的回归不是简单的重复,而是一种升华。输入法的速度取决于编码的场地*寻找这个键的时间。传统的双拼,记住编码太难,寻找每个键的时间太长,并且增加了编码上的歧义。根据香农第一定理可以计算理论上每个汉字的*均最短码长。全拼不仅编码*均长度较少,而且根据上下文的语言模型可以很好的解决歧义问题。利用统计语言模型可是实现拼音转汉字的有效算法,而且可以转换为动态规划求最短路径问题。如今各家输入法的效率基本在一个量级,进一步提升的关键就在于建立更好的语言模型。可以根据每个用户建立个性化的语言模型。输入的过程本身就是人和计算机的通信,好的输入法会自觉或者不自觉的的遵循通信的数学模型。要做出最有效的输入法,应该自觉使用信息论做指导。
第二十二章《自然语言处理的教父马库斯和他的优秀弟子们》:将自然语言处理从基于规则到基于统计,贡献最大的两个人,一个是前面介绍的贾里尼克教授,他是一个开创性任务;另一个是将这个方法发扬光大的米奇·马库斯。马库斯的贡献在于建立了造福全世界研究者的宾夕法尼亚大学LDC语料库以及他的众多优秀弟子。马库斯的影响力很大程度上是靠他的弟子传播出去的。马库斯教授有很多值得钦佩的地方:给予他的博士研究生自己感兴趣的课题的**,高屋建瓴,给学生关键的指导;宽松的管理方式,培养各有特点的年轻学者;是一个有着远见卓识的管理者。他的学生为人做事风格迥异,但都年轻有为,例如追求完美的迈克尔·柯林斯和寻求简单美的艾克尔·*。大师之所以能成为大师,肯定有着一些优秀的品质和追求。
第***章《布隆过滤器》:判断一个元素是否在一个集合当中时,用到了布隆过滤器,存储量小而且计算快速。其原理是:建立一个很长的二进制,将每个元素通过随机数产生器产生一些信息指纹,再将这些信息指纹映射到一些自然数上,最后在建立的那个很长的二进制上把这些自然数的位置都置为1。布隆过滤器的不足之处是它可能把不在集合中的元素错判成集合中的元素,但在某些条件下这个概率是很小的,补救措施是可以建立一个小的白名单,存储那些可能误判的元素。布隆过滤器背后的数学原理在于完全随机的数字其冲突的可能性很小,可以用很少的空间存储大量的信息,并且由于只进行简单的算术运算,因此速度非常快。《编程珠玑》中第一章的那个例子就是布隆过滤器的思想。开阔思维,寻找更好更简单的方法。
第***章《马尔科夫链的扩展——贝叶斯网络》:贝叶斯网络是马尔科夫链的扩展,由简单的线性链式关系扩展为网络的关系,但贝叶斯网络仍然假设每一个状态只与它直接相连的状态相关。确定贝叶斯网络的拓扑结构和各个状态之间相关的概率也需要训练。在词分类中,可以建立文章、主题和关键词的贝叶斯网络,用来得到词的分类。贝叶斯网络的训练包括确定拓扑结构和转移概率,比较复杂,后者可以参考最大熵训练的方法。贝叶斯网络导出的模型是非常复杂的。
第二十五章《条件随机场和句法分析》:句法分析是分析出一个句子的句子结构,对于不规则的句子,对其进行深入的分析是很复杂的,而浅层的句法分析在很多时候已经可以满足要求了。条件随机场就是进行浅层句法分析的有效的数学模型。条件随机场与贝叶斯网络很像,不用之处在于,条件随机场是无向图,而贝叶斯网络是有向图。条件随机场的训练很复杂,简化之后可以参考最大熵训练的方法。对于条件随机场的详细参数及原理还不理解。
第二十六章《维特比和他的维特比算法》:维特比算法是一个动态规划算法,凡是使用隐马尔科夫模型描述的问题都可以用它来解码。维特比算法采用逐步渐进的方法,计算到每步的最短距离,到下步的最短距离只用接着本步的计算即可,相比穷举法,**缩短了计算的时间,并且基本可以实现实时的输出,这看似简单,但在当时确是很了不起的。维特比并不满足停留在算法本身,他将算法推广出去,并应用到了实际中,创立了高通公司,成为了世界上第二富有的数学家。高通公司在第二代移动通信中并不占很强的市场地位,而其利用CDMA技术霸占了3G的市场,可见远见的洞察力是多么的重要。
第二十七章《再谈文本分类问题——期望最大化算法》:该章讲的其实就是K均值聚类问题,设置原始聚类中心,然后不断迭代,直至收敛,将每个点分到一个类中。其实隐马尔科夫模型的训练和最大熵的训练都是期望最大化算法(EM)。首先,根据现有的模型,计算各个观测数据输入到模型中的计算结果,这个过程称为期望值计算过程,或E过程;接下来,重新计算模型参数,以最大化期望值,这个过程称为最大化的过程,或M过程。优化的目标函数如果是个凸函数,则一定有全局最优解,若不是凸函数,则可能找到的是局部最优解。在以后的一些问题求解过程中,应该考虑其是否是EM问题,也可以考虑参考这种思想,不断迭代以优化目标的过程。
第二十八章《逻辑回归和搜索广告》:雅虎和百度的竞价排名广告并不比谷歌的根据广告的预估点击率来客观的推送广告收入多。点击预估率有很多影响因素,一种有效的方法是逻辑回归模型,逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型。其训练方法和最大熵模型相似。同样不是很理解其具体内涵。
第二十九章《各个击破和Google云计算的基础》:分而治之,各个击破是一个很好的方法,Google开发的MapReduce算法就应用了该方法。将一个大任务分成几个小任务,这个过程叫Map,将小任务的结果合并成最终结果,这个过程叫Reduce,该过程如何调度、协调就是工程上比较复杂的事情了。可见大量用到的、真正有用的方法往往简单而又朴实。
附录《计算复杂度》:计算机中复杂度是以O()来表示的,如果一个算法的计算量不超过N的多项式函数,则称算法为多项式函数复杂度的(P问题),是可以计算的。若比N的多项式函数还高,则是非多项式问题,实际上是不可计算的。非多项式问题中一种非确定的多项式问题(简称NP),是科学家研究的焦点,因为现实中好多问题都是NP问题。另外还有NP-Complete问题(NP问题可以在多项式时间内规约到该问题)和NP-Hard问题,对于这两种问题,需要简化找到近似解。
整体上,《数学之美》这本书让我了解了很多文本处理,数据挖掘相关的知识,学到了很多。其中,简单美以及一些科学家的大师风范让我印象深刻!书中提到的一些思想(即道)让我受益匪浅!
《数学之美》读书笔记3
我是在读了吴军博士的《浪潮之巅》之后,发现推荐了《数学之美》这本书。我到豆瓣读书上看了看评价,就果断在当当上下单买了一本研读。本来我以为这是一本充满各种数学专业术语的书,读后让我非常震撼的是吴军博士居然能用非常通俗的语言将自然语言处理等高深理论解释的相当简单。在李开复博士之后,吴军博士又成为了目前备受瞩目的具有深厚技术背景的作家。对于我来说,读这本书有扫盲的功效,让我知道了很多以前不知道的东西。我的想法是在研究生阶段,不只局限于导师的研究方向,通过更加广泛的涉猎知识,去寻找一个自己喜欢的研究领域。如果找到了这样一个领域,那么我就读博士。如果没有的话,那么我想还是工作算了。
1、学科之间的联系是如此的重要
全书主要是围绕着吴军博士所研究的自然语言处理方向来讲述一些应用在这个研究领域的数学知识,用了很大篇幅讲解了将通信的原理应用到自然语言处理上所取得的'巨大成功。以前学习计算机网络的时候,学过一个香农定理。对香农的认识就从香农定理开始,因为考研会考相关的计算题。看了这本书才知道,香农的《信息论》对今天的影响真的是不可估量。通过这样一个过程,我也对以前的本科学校的学科建设产生了一些忧虑。对于培养计算机人才来说,无论是培养应用型人才,还是培养研究型人才,都应该与电子、通信有一定的交叉,这样对学生思考问题的启发与视野的开阔有着重要的作用。计算机本身就是从电子、通信、数学等学科中抽出来的新兴的学科,在发展了多年之后,我们发现它仍然需要继承一些传统。回想自己的本科四年,上的更多的课时
语言类、技术类的课程,这些课程的确对提升学生的就业有很大帮助。但是我想说的是,一个忽视数学基础、学科交叉的学校,他无法成为一所**的一流大学。作为一个母校培养的学生,我深知**的阻力与困难,但是我希望母校的计算机学院能越办越好。我们现在已经培养出很多高薪优秀的技术人才,我希望将来也能培养出更多的研究型人才。
2、看起来很牛的东西却用着难以置信的简单数学原理
在整本书中让我最为印象深刻的是解释Google搜索的原理,居然就是简单的布尔代数运算。这个的确让我大跌眼镜,我一直认为搜索时一个非常复杂而庞大的问题,其数学原理也是相当高深的,但是吴军博士的解释让我大开眼界。与此同时也知道了Google为什么牛,牛在哪了。搜索的原理虽然非常简单,但是搜索是一个需要对海量数据进行操作的工作。Google在海量数据的处理方面的确是相当先进的,MapReduce、BigTable等等一些技术的发明与应用使得Google在搜索上无出其右。目前分布式存储、分布式计算、数据仓库与存储等研究领域近些年来的大热也说明Google在引领研究方向上的超凡本领。
3、感谢概率老师的教诲
在大二的时候,有一个在我们学生中声望很高的概率老师,他在课程即将结束的时候跟我们说我们将的是前几章,这些事概率论与数理统计的基础。对于你们计算机的学生来时,后面的章节才是最有用的,以后一定要好好的研究,弄上一两个在你的毕业设计上就会让你毕业设计提升一个档次,有可能验收你毕业设计的老师也不懂。我当时对他的话没有特别在意,我只关心期末考试要考哪些题目,因为我那个学期的概率课基本上都在睡觉,只有他讲笑话的时候不睡。我看《数学之美》后发现马尔科夫链、贝叶斯网络之后,对以前的概率老师充满无限的敬意。我发现我们再本科阶段学习的《高等数学》、《线性代数》、《概率论与数理统计》在计算机学科应用较多的要数概率论与数理统计,还有一门我学的不好的《离散数学》在计算机中也是有着举足轻重的地位。我在看米歇尔的《机器学习》时也发现很多熟悉的概率论与数理统计的知识,这让我不得不开始考虑重新弥补自己的数学短板。我的想法是在研一这一年把概率论与数理统计、线性代数、离散数学尽我最大的努力补一补,希望他们对我今后的学习有所帮助。
4、说说作者吴军博士
吴军博士写的书对于学习计算机的学生来说,读起来有种说不出的亲切感。可能这跟他是技术出身的原因有关,流畅的文笔、质朴的文风也让人读起来很舒服。看**松在优酷上的《晓说》就知道,在硅谷有着众多的华裔工程师,他们很多都来自清华、北大等**的名牌大学,这些人在**实现着自己的梦想。吴军博士也曾是这其中的一员,我非常希望那些像吴军博士一样的牛人们能够写书或者来**的大学做一些演讲、论坛等等,开阔一下我们的视野,传授一下做学问的经验。与此同时,我也在想为什么我们国家那么多优秀的IT人才都去了**。
这个问题在我去苹果公司在东软信息学院**的培训过程中得到了答案,那个南京邮电的老师讲了讲*为什么不像**那么有创造力。我们*人并不缺乏创造力,很多时候是我们所处的外部环境恰恰阻碍了创新。我想那么多优秀的清华北大学子纷纷到大洋彼岸的**,正是被**开放的学术环境、创新氛围所吸引,每个人都有自己的梦想,他们去**也是为了能实现自己的梦想。以前都觉得他们是不爱国,现在长大了,对于这个问题看得更清楚了一点。
我想说我们的祖国在经历了**开放30多年的飞速发展之后,目前正处于一个关键和脆弱的时期。我们靠着人口红利取得了巨大的成就,我们能不能凭借人才红利取得更大的成就还是未知。希望有更多的人才能像李开复博士、吴军博士那样,为我们这个民族青年的成长和国家发展做出贡献。
《数学之美》读书笔记4
本书介绍了Google产品中涉及的自然语言处理、统计语言模型、中文分词、信息度量、拼音输入法、搜索引擎、网页排名、密码学等内容背后的数学原理。让我们看到了布尔代数、离散数学、统计学、矩阵计算、马尔科夫链等似曾相识的内容在实际生活中的应用。相比于其他数学题材书籍,吴军老师把抽象、深奥的数学方法解释得通俗易懂,书中同时引用了诸多的历史典故和人物介绍,给人以很多启发,也让人由衷感叹数学的简洁和强大。
虽是数据专业毕业,但是才疏学浅,无力对数学的美进行阐述。仅就书中两个比较喜欢的地方发表一点不成熟的见解,与诸位共勉。
其一,在讲Google的搜素引擎反作弊时谈到做事情的两种境界“道”和“术”,术就是具体的做事方法,而道则是隐藏在问题背后的动机和本质。在术这个层面解决问题要付出更多的努力,有点类似于我们常说的“头疼医头,脚疼医脚”,暂时不疼了,过几天复发了,再去医治,如此往复,无法从根本上解决;而只有找到了致病原因,才能做到药到病除,根本治愈。本人之前参与过行内月终自动核对的研发,月终核对初期数据的不一致性只能靠数百业务人员人工核对数据差异,然后修改数据,每月1日都要加班加点,工作量很大,这是从术上解决问题。后来找到了产生差异的原因是会计核算时的利息调整造成的,把这些数据接过来进行相应冲减后差异就消失了,业务人员也不用来加班了,这才是从道上解决问题。
其二,是在做中文网页排名时提到的从业界成功的秘诀之一:“先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题。许多时候做事失败,不是因为人不够优秀,而是做事的方法不对。一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之”。我们在做项目时也是一样,业务有时要的功能非常急,可能有些功能也实现不了(比如系统响应时间长、查询明细不能**省行等)。这时我们就要将焦点关注在那些可以实现的80%的功能上,哪怕刚刚上线的系统界面丑点,操作复杂点,反应速度慢点,但是至少业务有可用的系统,剩下时间再去优化那剩下的20%。这样可以帮助我行抢占先机,在与同行业的竞争中取得主动。如果等待我们把所有的细节都搞清楚再动手开发,力求完美,那么很可能系统能够上线的时候业务已经不需要了。
数学之美,也就是简单之美。希望大家能够喜欢数学,喜欢数学之美。
《数学之美》读书笔记5
很多人都觉得,数学是一个太高深、太理论的学科,不接近生活,对我们大多数人来说*时也根本用不到,所以没必要去理解数学。但事情真的是这样吗?
其实不然,数学一直渗透在我们生活的各个方面,尤其是在今天这个信息时代,很多简单朴素的数学思想,能发挥一般人很难想象的巨大作用。比如,计算机处理自然语言,用到的最重要工具是统计学的思想;计算机对**内容的分类,依靠的是数学里的余弦定理;而电子电路的基本逻辑,则来源于仅有0和1两个数字的布尔代数。
在《数学之美》里,吴军用自己在工作中使用数学的亲身经历,为我们展现了数学的重要性,以及他对数学之美的理解。吴军是“得到”App专栏《吴军的谷歌方法论》的主理人。曾先后供职于谷歌和腾讯,是著名的自然语言处理专家和搜索专家。同时,他还是位畅销书作家,除了这本《数学之美》以外,还写过《文明之光》《智能时代》《浪潮之巅》等多本畅销书。
《数学之美》读书笔记6
我在想,为什么我们要学习数学?也许这个问题成年人有一万个答案,可是当我们第一次走进教室,学习数学的时候,大概率还是个孩子,你怎么跟一个孩子解释为什么要学习数学呢?我把这个问题抛给了一个朋友,他说:“为了提高思维逻辑能力,这是我初中老师在第一节数学课上告诉我们的”。或者一位5岁的小朋友又会问:“什么是逻辑能力呢?”
也许从出生第一天,我们就一直在被动的接收一些东西,父母的劝导,老师的.传授,可5岁的孩子还是会把玩具散落一地,6岁的孩子仍然会因为父母不给买玩具而嗷嗷大哭,无论你怎么劝导一个人,怎么劝诫一个人,他可能仍然会犯你认为会出现的错误。我记得有位教育专家这么说:“你告诉宝宝他把玩具弄坏了,就等于丢了10个棒棒糖”,从此以后这个宝宝可能会更加珍惜玩具。这个方法很简单,但是貌似最有效。数学是什么?数学不就是把复杂的东西简单化么?
现在我们再回答前面的问题:为什么我要学习数学?我们可以这么跟5岁的小朋友说:“妈妈给你10元钱,让你买酱油,酱油7元、棒棒糖1元一个,剩下的钱你可以买几个棒棒糖?”或许想吃棒棒糖的就会苦思冥想一番,或许未来妈妈真的给他10元钱去买酱油,结果回来就变成了一瓶酱油和3个棒棒糖。或者再过一段时间,这位小朋友会选择6元的酱油,因为可以获得4个棒棒糖了。他这么计算着:7+3和6+4都可以等于10,那么如果要必须买酱油的情况下,1+9也可以等于10。我们都知道也有1元的袋装酱油,于是9个棒棒糖到手了。任何知识的魅力都在于自我的发现,只有你对它产生了无限的兴趣,你就会不断的发现它的美,《数学之美》也可以变成《物理之美》。
有些人会说,上面的例子是利益驱动型,不是兴趣驱动型,对于一个孩子来说,你能指望他向**那样:“我需要的不是物质世界,我需要的是精神世界?”5岁宝宝最喜欢做得事情就是在吃和玩上面,请问,成年人不也是如此么?这就是天性。只不过成年人的自控能力足够大罢了。
我们回到书本上,这本书是否合适自己?如果没有专业的数学知识,很难读懂。但是它又有着无限的魅力,让你不自觉的读下去,为什么?因为“数学之美”,虽然大多数人看不懂里面的公式,但是能够明白数学能解决的问题:概率统计学能够解决自然语言处理、布尔代数能解决搜索引擎的问题、有限状态机和动态规划能解决地图问题、向量+特征向量+余弦定理能解决自动**分类问题、最大熵模型解决金融问题,看着看着我就莫名的产生了一种想要学习算法的冲动,这不就是本书的意义所在么?
《数学之美》读书笔记7
吴军2012年的作品,源于其在谷歌黑板报的系列文章,讲述数学方法在信息技术中的应用,说明了为什么科学研究中方法论如此的重要,以及数学如何简单优雅地解决问题,直达本质。对比他的其他作品比如《浪潮之巅》、《硅谷之谜》,本书比较偏技术,属于目前大热的数据科学(Data Science)范畴,在云计算、大数据和人工智能等成为常态和趋势的今天,适合所有对IT技术及相关管理人员阅读。对我而言,最大的收获包括:
规则vs.算法:自然语言处理,在早期几十年基于文法规则都无法达到可应用的效果,终于在转变为基于统计方法且积累了足够数据后,形成了突破,达到了今日可大规模商用的效果。再次说明了数据及算法在今日的重要性。
一些常见应用涉及的优化算法:搜索相关(分词、网络爬虫、索引、结果排名、广告及反作弊)、文本处理(**分类、广告相关性、输入法)、地图路线规划、信息指纹、密码学等。这些算法不止适用于这些应用场景,还可以在其他许多地方借鉴,比如用户评论分析也需要用分词和语义分析,许多价值优化算法都需要用到期望值最大化和逻辑回归等。
优雅的理论模型:在初始阶段,出于时间和成本考虑,在技术实现上可能会使用一些拼凑的方法,甚至山寨,但是这种方法并不可持续,很难进行系统化的优化,开发维护成本都很高,最终会遇到灾难性问题。做事情需要有境界,最求简单而优雅的理论和工程实现,这在长期是非常有好处的。
吴军使用浅显易懂的语言,把解决问题的思路和复杂的数学模型讲得很清楚,虽然理解延伸阅读里的具体数学公式还是有些挑战。其实重要的是思想和方法,具体的实现可以在用到时再进一步的了解。如何用简单的语言把复杂的技术讲清楚,也是我工作的需要,要不断学习磨练。书里提到了启发吴军这方面能力的两本书,即《从0到无穷大》和《时间简史》,会有要去看下。
《数学之美》读书笔记8
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道----解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。
第二章《自然语言处理----从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能****的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法---基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型,就可以解决好多机器学习的问题,训练中会涉及到一些经典的算法(维特比算法等)。关于这个模型,没有实际实现过,所以感觉好陌生,只是知道了些概率论讲过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我**你”。贾里克尼教授一生专注学习,最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。
在这章中对于少年时的教育,以下几点值得借鉴:
1、少年时期其实没有必要花那么多时间读书,他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。
2、中学时花大量时间学会的内容,在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。
3、学习(和教育)是一个人一辈子的过程。
4、书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美----布尔代数和搜索引擎的索引》:布尔是19世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1,为了适应索引访问的速度、附加的信息、更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运算。牛顿的一句话“(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的”。做好搜索,最基本的要求是每天分析10-20个不好的搜索结果,积累一段时间才有感觉。有时候,学习、处理问题,可以从不好的方面入手,效果可能更好。
第九章《图论和网络爬虫》:图的遍历分为“广度优先搜索(Breadth-FirstSearch,简称BFS)”和“深度优先搜索(Depth-FirstSearch,简称DFS)。互联网上有几百亿的网页,需要大量的服务器用来下载网页,需要协调这些服务器的任务,这就是网络设计和程序设计的艺术了。另外对于简单的网页,没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过(如果记录每个网页的url,数量太多,这里可以用后面提到的信息指纹,只需要一个很多位的数字即可),避免重复下载。另外,在图论出现的很长一段时间里,实际需求的图只有几千个节点,那时图的遍历很简单,人们都没有怎么专门研究这个问题,随着互联网的出现,图的遍历一下子有了用武之地,很多数学方法就是这样,看上去没有什么用途,等到具体的应用出来了一下子开始派上大用场了,这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单,但里面的每个东西都可能是一个复杂的东西,需要很好的设计。
第十章《PageRank----Google的**表决式网页排名技术》:搜索返回了成千上万条结果,如何为搜索结果排名?这取决与两组信息:关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量,该算法的思想是如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难,可是当时只有佩奇和布林想到了,为什么呢?
第十一章《如何确定网页和查询的相关性》:构建一个搜索引擎的四个方面:如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF,TF衡量一个词在一个网页中的权重,即词频。IDF衡量一个词本身的权重,对主题的预测能力。一个查询和该网页的相关性公式由词频的简单求和变成了加权求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN。看似复杂的搜索引擎,里面的原理竟是这么简单!
第十二章《地图和本地搜索的最基本技术——有限状态机和动态规划》:地址的解析依靠有限状态机,当用户输入的地址不太标准或有错别字时,希望进行模糊匹配,提出了一种基于概率的有限状态机。通用的有限状态机的程序不是很好写,要求很高,建议直接采用开源的代码。图论中的动态规划问题可以用来解决两点间的最短路径问题,可以将一个“寻找全程最短路线”的问题,分解成一个个寻找局部最短路线的小问题。有限状态机和动态规划问题需要看相关的算法讲解,才能深入理解,目前对其并未完全理解。
第十三章《GoogleAK-47的设计者——阿米特·辛格博士》:辛格坚持选择简单方案的一个原因是容易解释每一个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。辛格要求对于搜索质量的改进方法都要能说清楚理由,说不清楚理由的改进即使看上去有效也不会采用,因为这样将来可能是个隐患。辛格非常鼓励年轻人要不怕失败,大胆尝试。遵循简单的哲学。
第十四章《余弦定理和**的分类》:将**根据词的TF-IDF值组成**的特征向量,然后根据向量之间的余弦距离衡量两个特征之间的相似度,将**自动聚类。另外根据词的不同位置,权重应该不同,比如标题的词权重明显应该大点。大数据量的余弦计算也要考虑很多简化算法。
第十五章《矩阵运算和文本处理中的两个分类问题》:将大量的文本表示成文本和词汇的矩阵,然后对该矩阵进行奇异值SVD分解,可以得到隐含在其中的一些信息。计算余弦相似度的一次迭代时间和奇异值分解的时间复杂度在一个数量级,但计算余弦相似度需要多次迭代。另外,奇异值分解的一个问题是存储量大,而余弦定理的聚类则不需要。奇异值分解得到的结果略显粗糙,实际工作中一般先进行奇异值分解得到粗分类结果,在利用余弦计算得到比较精确地结果。我觉得这章讲的SVD有些地方不是很清楚,已向吴军老师请教了,等待回信。
第十六章《信息指纹及其应用》:信息指纹可以作为信息的唯一标识。有很多信息指纹的产生方法,互联网加密要使用基于加密的伪随机数产生器,常用的算法有MD5或者SHA-1等标准。信息指纹可以用来判定集合相同或基本相同。YouTobe就用信息指纹来反盗版。128位的指纹,1.8*10^19次才可能重复一次,所以重复的可能性几乎为0。判定集合是否相同,从简单的逐个比对到利用信息指纹,复杂度降低了很多很多。启发我们有时候要用变通的思想来解决问题。
第十七章《由电视剧《**》所想到的——谈谈密码学的数学原理》:RSA加密算法,有两个完全不同的钥匙,一个用于加密,一个用于解密。该算法里面蕴含着简单但不好理解的数学思想。信息论在密码设计中的应用:当密码之间分布均匀并且统计**时,提供的信息最少。均匀分布使得敌人无从统计,而统计**能保证敌人即使知道了加密算法,也不能破译另一段密码。
第十八章《闪光的不一定是金子——谈谈搜索引擎反作弊问题》:把搜索反作弊看成是通信模型,作弊当做是加入的噪声,解决噪声的方法:从信息源出发,增强排序算法的抗干扰能力;过滤掉噪声,还原信息。只要噪声不是完全随机并且前后有相关性,就可以检测到并消除。作弊者的方法不可能是随机的,且不可能一天换一种方法,及作弊是时间相关的。因此在搜集一段时间的作弊信息后,就可以将作弊者抓出来,还原原有的排名。一般作弊都是针对市场份额较大的搜索引擎做的,因此,一个小的搜索引擎作弊少,并不一定是它的反作弊技术好,而是到它那里作弊的人少。
第十九章《谈谈数学模型的重要性》:早期的行星运行模型用大圆套小圆的方法,精确地计算出了所有行星运行的轨迹。但其实模型就是简单的椭圆而已。一个正确的数学模型应该在形式上是简单的;一个正确的模型可能开始还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;大量准备的数据对研发很重要;正确的模型可能受到噪声干扰,而显得不准确,这是不应该用一种凑合的修正方法来弥补它,要找到噪声的根源,这也许能通往重大的发现。
第二十章《不要把鸡蛋放在一个篮子里——谈谈最大熵模型》:对一个随机事件预测时,当各种情况概率相等时,信息熵达到最大,不确定性最大,预测的风险最小。最大熵模型的训练非常复杂,需要时查看资料做进一步的理解。
第二十一章《拼音输入法的数学原理》:输入法经历了以自然音节编码,到偏旁笔画拆字输入,再回归自然音节输入的过程。任何事物的发展,螺旋式的回归不是简单的重复,而是一种升华。输入法的速度取决于编码的场地*寻找这个键的时间。传统的双拼,记住编码太难,寻找每个键的时间太长,并且增加了编码上的歧义。根据香农第一定理可以计算理论上每个汉字的*均最短码长。全拼不仅编码*均长度较少,而且根据上下文的语言模型可以很好的解决歧义问题。利用统计语言模型可是实现拼音转汉字的有效算法,而且可以转换为动态规划求最短路径问题。如今各家输入法的效率基本在一个量级,进一步提升的关键就在于建立更好的语言模型。可以根据每个用户建立个性化的语言模型。输入的过程本身就是人和计算机的通信,好的输入法会自觉或者不自觉的的遵循通信的数学模型。要做出最有效的输入法,应该自觉使用信息论做指导。
第二十二章《自然语言处理的教父马库斯和他的优秀弟子们》:将自然语言处理从基于规则到基于统计,贡献最大的两个人,一个是前面介绍的贾里尼克教授,他是一个开创性任务;另一个是将这个方法发扬光大的米奇·马库斯。马库斯的贡献在于建立了造福全世界研究者的宾夕法尼亚大学LDC语料库以及他的众多优秀弟子。马库斯的影响力很大程度上是靠他的弟子传播出去的。马库斯教授有很多值得钦佩的地方:给予他的博士研究生自己感兴趣的课题的**,高屋建瓴,给学生关键的指导;宽松的管理方式,培养各有特点的年轻学者;是一个有着远见卓识的管理者。他的学生为人做事风格迥异,但都年轻有为,例如追求完美的迈克尔·柯林斯和寻求简单美的艾克尔·*。大师之所以能成为大师,肯定有着一些优秀的品质和追求。
第***章《布隆过滤器》:判断一个元素是否在一个集合当中时,用到了布隆过滤器,存储量小而且计算快速。其原理是:建立一个很长的二进制,将每个元素通过随机数产生器产生一些信息指纹,再将这些信息指纹映射到一些自然数上,最后在建立的那个很长的二进制上把这些自然数的位置都置为1。布隆过滤器的不足之处是它可能把不在集合中的元素错判成集合中的元素,但在某些条件下这个概率是很小的,补救措施是可以建立一个小的白名单,存储那些可能误判的元素。布隆过滤器背后的数学原理在于完全随机的数字其冲突的可能性很小,可以用很少的空间存储大量的信息,并且由于只进行简单的算术运算,因此速度非常快。《编程珠玑》中第一章的那个例子就是布隆过滤器的思想。开阔思维,寻找更好更简单的方法。
第***章《马尔科夫链的扩展——贝叶斯网络》:贝叶斯网络是马尔科夫链的扩展,由简单的线性链式关系扩展为网络的关系,但贝叶斯网络仍然假设每一个状态只与它直接相连的状态相关。确定贝叶斯网络的拓扑结构和各个状态之间相关的概率也需要训练。在词分类中,可以建立文章、主题和关键词的贝叶斯网络,用来得到词的分类。贝叶斯网络的训练包括确定拓扑结构和转移概率,比较复杂,后者可以参考最大熵训练的方法。贝叶斯网络导出的模型是非常复杂的。
第二十五章《条件随机场和句法分析》:句法分析是分析出一个句子的句子结构,对于不规则的句子,对其进行深入的分析是很复杂的,而浅层的句法分析在很多时候已经可以满足要求了。条件随机场就是进行浅层句法分析的有效的数学模型。条件随机场与贝叶斯网络很像,不用之处在于,条件随机场是无向图,而贝叶斯网络是有向图。条件随机场的训练很复杂,简化之后可以参考最大熵训练的方法。对于条件随机场的详细参数及原理还不理解。
第二十六章《维特比和他的维特比算法》:维特比算法是一个动态规划算法,凡是使用隐马尔科夫模型描述的问题都可以用它来解码。维特比算法采用逐步渐进的方法,计算到每步的最短距离,到下步的最短距离只用接着本步的计算即可,相比穷举法,**缩短了计算的时间,并且基本可以实现实时的输出,这看似简单,但在当时确是很了不起的.。维特比并不满足停留在算法本身,他将算法推广出去,并应用到了实际中,创立了高通公司,成为了世界上第二富有的数学家。高通公司在第二代移动通信中并不占很强的市场地位,而其利用CDMA技术霸占了3G的市场,可见远见的洞察力是多么的重要。
第二十七章《再谈文本分类问题——期望最大化算法》:该章讲的其实就是K均值聚类问题,设置原始聚类中心,然后不断迭代,直至收敛,将每个点分到一个类中。其实隐马尔科夫模型的训练和最大熵的训练都是期望最大化算法(EM)。首先,根据现有的模型,计算各个观测数据输入到模型中的计算结果,这个过程称为期望值计算过程,或E过程;接下来,重新计算模型参数,以最大化期望值,这个过程称为最大化的过程,或M过程。优化的目标函数如果是个凸函数,则一定有全局最优解,若不是凸函数,则可能找到的是局部最优解。在以后的一些问题求解过程中,应该考虑其是否是EM问题,也可以考虑参考这种思想,不断迭代以优化目标的过程。
第二十八章《逻辑回归和搜索广告》:雅虎和百度的竞价排名广告并不比谷歌的根据广告的预估点击率来客观的推送广告收入多。点击预估率有很多影响因素,一种有效的方法是逻辑回归模型,逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型。其训练方法和最大熵模型相似。同样不是很理解其具体内涵。
第二十九章《各个击破和Google云计算的基础》:分而治之,各个击破是一个很好的方法,Google开发的MapReduce算法就应用了该方法。将一个大任务分成几个小任务,这个过程叫Map,将小任务的结果合并成最终结果,这个过程叫Reduce,该过程如何调度、协调就是工程上比较复杂的事情了。可见大量用到的、真正有用的方法往往简单而又朴实。
附录《计算复杂度》:计算机中复杂度是以O()来表示的,如果一个算法的计算量不超过N的多项式函数,则称算法为多项式函数复杂度的(P问题),是可以计算的。若比N的多项式函数还高,则是非多项式问题,实际上是不可计算的。非多项式问题中一种非确定的多项式问题(简称NP),是科学家研究的焦点,因为现实中好多问题都是NP问题。另外还有NP-Complete问题(NP问题可以在多项式时间内规约到该问题)和NP-Hard问题,对于这两种问题,需要简化找到近似解。
整体上,《数学之美》这本书让我了解了很多文本处理,数据挖掘相关的知识,学到了很多。其中,简单美以及一些科学家的大师风范让我印象深刻!书中提到的一些思想(即道)让我受益匪浅!
《数学之美》读书笔记9
最近看了这本《数学之美》,不得不感叹一句,可惜早已身不在起点。
我读书的时候,数学成绩一直都很好,虽然离开学校已经10多年,自觉当初的知识还是记得很多,6~7年前再考线性代数和概率论,还是得到了很高的分数。不过我也和大部分人一样,觉得数学没有太多用处,特别是高中和大学里面学的,那些三角函数,向量,大数定律,解析几何,除了在考试的题目里面用一下,*时又有什么地方可以用呢?
看了《数学之美》,惊叹于数学的浩瀚和简单,说它浩瀚,是因为它的分支涵盖了科学的方方面面,是所有科学的理论基础,说它简单,无论多复杂的问题,最后总结的数学公式都简单到只有区区几个符号和字母。
这本书介绍数学理论在互联网上的运用,*时我们在使用互联网搜索或者翻译功能的时候,时常会感叹电脑对自己的了解和它的聪明,其实背后的原理就是一个个精美的算法和大量数据的训练。那些或者熟悉或者陌生的数学知识(联合概率分布,维特比算法,期望最大化,贝叶斯网络,隐形马尔可夫链,余弦定律,etc),一步步构建了我们现在所赖以生存的网上世界。
之所以觉得自己早已身不在起点,是因为上面这些数学知识,早已经不在我的知识框架之内,就算曾经学过,也不过是囫囵吞枣一样的强记硬背,没有领会过其中的真正意义。而今天想重头在来学一次,其实已经不可能了。且不说要花费多少的精力和时间,还需要的是领悟力。而这一些,已经不是我可以简单付出的。
不像物理、化学需要复杂的实验来验证,很多数学的证明,几乎只要有一颗聪明的头脑和无数的草稿纸,可是光是这颗聪明的头脑,就可以阻拦掉很多人。有人说多读书就会聪明,我不否认,书本的确会提供很多知识,可是不同的人读同一本书也会有不同的收货,这就限制于每个人的知识框架和认知水*。就如一个数学功底好过我的人,看这本书,就会更容易理解里面的公式和推导出这些公式的其他运用点,而我,只能站在数学的门口,感叹一句,它真的好美吧。
当然,我暂时无法在实际生活中运用这些数学公式,可是书中提到的一些方法论,还是很有帮助的
1)一个产业的颠覆或者创新,大部分来自于外部的力量,比如用统计学原理做自然语言处理。
2)基础知识和基础数据是很重要性,只有足够多和足够广的数据,才可以提供有效的分析,和验证分析方法的好坏。
3)先帮用户解决80%的问题,在慢慢解决剩下的20%的问题;
4)不要等一个东西完美了,才发布;
5)简单是美,坚持选择简单的做法,这样会容易解释每一个步骤和方法背后的道理,也便于查错。
6)正确的模型也可能受噪音干扰,而显得不准确;这时不应该用一种凑合的修正方法加以弥补,而是要找到噪音的根源,从根本上修正它。
7)一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物。
《数学之美》读书笔记10
很多人都觉得,数学是一个太高深、太理论的学科,不接近生活,对我们大多数人来说*时也根本用不到,所以没必要去理解数学。但事情真的是这样吗?
其实不然,数学一直渗透在我们生活的各个方面,尤其是在今天这个信息时代,很多简单朴素的数学思想,能发挥一般人很难想象的巨大作用。比如,计算机处理自然语言,用到的最重要工具是统计学的思想;计算机对**内容的分类,依靠的是数学里的余弦定理;而电子电路的基本逻辑,则来源于仅有0和1两个数字的布尔代数。
在《数学之美》里,吴军用自己在工作中使用数学的亲身经历,为我们展现了数学的重要性,以及他对数学之美的理解。吴军是“得到”App专栏《吴军的谷歌方法论》的主理人。曾先后供职于谷歌和腾讯,是著名的自然语言处理专家和搜索专家。同时,他还是位畅销书作家,除了这本《数学之美》以外,还写过《文明之光》《智能时代》《浪潮之巅》等多本畅销书。
朱光潜《谈美书简》读书笔记10篇(扩展5)
——《数学之美》读书笔记10篇
《数学之美》读书笔记1
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道————解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会?给你带来解决问题的灵感。
第二章《自然语言处理————从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能****的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法———基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型,就可以解决好多机器学习的问题,训练中会涉及到一些经典的算法(维特比算法等)。关于这个模型,没有实际实现过,所以感觉好陌生,只是知道了些概率论讲过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我**你”。贾里克尼教授一生专注学习,最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。在这章中对于少年时的教育,以下几点值得借鉴:1、少年时期其实没有必要花那么多时间读书,他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。2、中学时花大量时间学会的内容,在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。3、学习(和教育)是一个人一辈子的过程。4、书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美————布尔代数和搜索引擎的索引》:布尔是19世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1,为了适应索引访问的速度、附加的信息、更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运算。牛顿的一句话“(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的”。做好搜索,最基本的要求是每天分析10—20个不好的搜索结果,积累一段时间才有感觉。有时候,学习、处理问题,可以从不好的方面入手,效果可能更好。
第九章《图论和网络爬虫》:图的遍历分为“广度优先搜索(Breadth—First Search,简称BFS)”和“深度优先搜索(Depth—First Search,简称DFS)。互联网上有几百亿的网页,需要大量的服务器用来下载网页,需要协调这些服务器的任务,这就是网络设计和程序设计的艺术了。另外对于简单的网页,没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过(如果记录每个网页的url,数量太多,这里可以用后面提到的信息指纹,只需要一个很多位的数字即可),避免重复下载。另外,在图论出现的很长一段时间里,实际需求的图只有几千个节点,那时图的遍历很简单,人们都没有怎么专门研究这个问题,随着互联网的出现,图的遍历一下子有了用武之地,很多数学方法就是这样,看上去没有什么用途,等到具体的应用出来了一下子开始派上大用场了,这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单,但里面的每个东西都可能是一个复杂的东西,需要很好的设计。
第十章《PageRank————Google的**表决式网页排名技术》:搜索返回了成千上万条结果,如何为搜索结果排名?这取决与两组信息:关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量,该算法的思想是如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难,可是当时只有佩奇和布林想到了,为什么呢?
第十一章《如何确定网页和查询的相关性》:构建一个搜索引擎的四个方面:如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF,TF衡量一个词在一个网页中的权重,即词频。IDF衡量一个词本身的权重,对主题的预测能力。一个查询和该网页的相关性公式由词频的简单求和变成了加权求和,即TF1*IDF1 + TF2*IDF2 + 。。。 + TFN*IDFN。看似复杂的搜索引擎,里面的原理竟是这么简单!
第十二章《地图和本地搜索的最基本技术——有限状态机和动态规划》:地址的解析依靠有限状态机,当用户输入的地址不太标准或有错别字时,希望进行模糊匹配,提出了一种基于概率的有限状态机。通用的有限状态机的程序不是很好写,要求很高,建议直接采用开源的代码。图论中的动态规划问题可以用来解决两点间的最短路径问题,可以将一个“寻找全程最短路线”的问题,分解成一个个寻找局部最短路线的小问题。有限状态机和动态规划问题需要看相关的算法讲解,才能深入理解,目前对其并未完全理解。
第十三章《Google AK—47的设计者——阿米特·辛格博士》:辛格坚持选择简单方案的一个原因是容易解释每一个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。辛格要求对于搜索质量的改进方法都要能说清楚理由,说不清楚理由的改进即使看上去有效也不会采用,因为这样将来可能是个隐患。辛格非常鼓励年轻人要不怕失败,大胆尝试。遵循简单的哲学。
第十四章《余弦定理和**的分类》:将**根据词的TF—IDF值组成**的特征向量,然后根据向量之间的余弦距离衡量两个特征之间的相似度,将**自动聚类。另外根据词的不同位置,权重应该不同,比如标题的词权重明显应该大点。大数据量的余弦计算也要考虑很多简化算法。
第十五章《矩阵运算和文本处理中的两个分类问题》:将大量的文本表示成文本和词汇的矩阵,然后对该矩阵进行奇异值SVD分解,可以得到隐含在其中的一些信息。计算余弦相似度的一次迭代时间和奇异值分解的时间复杂度在一个数量级,但计算余弦相似度需要多次迭代。另外,奇异值分解的一个问题是存储量大,而余弦定理的聚类则不需要。奇异值分解得到的结果略显粗糙,实际工作中一般先进行奇异值分解得到粗分类结果,在利用余弦计算得到比较精确地结果。我觉得这章讲的SVD有些地方不是很清楚,已向吴军老师请教了,等待回信。
第十六章《信息指纹及其应用》:信息指纹可以作为信息的唯一标识。有很多信息指纹的产生方法,互联网加密要使用基于加密的伪随机数产生器,常用的算法有MD5或者SHA—1等标准。信息指纹可以用来判定集合相同或基本相同。YouTobe就用信息指纹来反盗版。128位的指纹,1。8*10^19次才可能重复一次,所以重复的可能性几乎为0。判定集合是否相同,从简单的逐个比对到利用信息指纹,复杂度降低了很多很多。启发我们有时候要用变通的思想来解决问题。
第十七章《由电视剧《**》所想到的——谈谈密码学的数学原理》:RSA加密算法,有两个完全不同的钥匙,一个用于加密,一个用于解密。该算法里面蕴含着简单但不好理解的数学思想。信息论在密码设计中的应用:当密码之间分布均匀并且统计**时,提供的信息最少。均匀分布使得敌人无从统计,而统计**能保证敌人即使知道了加密算法,也不能破译另一段密码。
第十八章《闪光的不一定是金子——谈谈搜索引擎反作弊问题》:把搜索反作弊看成是通信模型,作弊当做是加入的噪声,解决噪声的方法:从信息源出发,增强排序算法的抗干扰能力;过滤掉噪声,还原信息。只要噪声不是完全随机并且前后有相关性,就可以检测到并消除。作弊者的方法不可能是随机的,且不可能一天换一种方法,及作弊是时间相关的。因此在搜集一段时间的作弊信息后,就可以将作弊者抓出来,还原原有的排名。一般作弊都是针对市场份额较大的搜索引擎做的,因此,一个小的搜索引擎作弊少,并不一定是它的反作弊技术好,而是到它那里作弊的人少。
第十九章《谈谈数学模型的重要性》:早期的行星运行模型用大圆套小圆的方法,精确地计算出了所有行星运行的轨迹。但其实模型就是简单的椭圆而已。一个正确的数学模型应该在形式上是简单的;一个正确的模型可能开始还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;大量准备的数据对研发很重要;正确的模型可能受到噪声干扰,而显得不准确,这是不应该用一种凑合的修正方法来弥补它,要找到噪声的根源,这也许能通往重大的发现。
第二十章《不要把鸡蛋放在一个篮子里——谈谈最大熵模型》:对一个随机事件预测时,当各种情况概率相等时,信息熵达到最大,不确定性最大,预测的风险最小。最大熵模型的训练非常复杂,需要时查看资料做进一步的理解。
第二十一章《拼音输入法的数学原理》:输入法经历了以自然音节编码,到偏旁笔画拆字输入,再回归自然音节输入的过程。任何事物的发展,螺旋式的回归不是简单的重复,而是一种升华。输入法的速度取决于编码的场地*寻找这个键的时间。传统的双拼,记住编码太难,寻找每个键的时间太长,并且增加了编码上的歧义。根据香农第一定理可以计算理论上每个汉字的*均最短码长。全拼不仅编码*均长度较少,而且根据上下文的语言模型可以很好的解决歧义问题。利用统计语言模型可是实现拼音转汉字的有效算法,而且可以转换为动态规划求最短路径问题。如今各家输入法的效率基本在一个量级,进一步提升的关键就在于建立更好的语言模型。可以根据每个用户建立个性化的语言模型。输入的过程本身就是人和计算机的通信,好的输入法会自觉或者不自觉的的遵循通信的数学模型。要做出最有效的输入法,应该自觉使用信息论做指导。
第二十二章《自然语言处理的教父马库斯和他的优秀弟子们》:将自然语言处理从基于规则到基于统计,贡献最大的两个人,一个是前面介绍的贾里尼克教授,他是一个开创性任务;另一个是将这个方法发扬光大的米奇·马库斯。马库斯的贡献在于建立了造福全世界研究者的宾夕法尼亚大学LDC语料库以及他的众多优秀弟子。马库斯的影响力很大程度上是靠他的弟子传播出去的。马库斯教授有很多值得钦佩的地方:给予他的博士研究生自己感兴趣的课题的**,高屋建瓴,给学生关键的指导;宽松的管理方式,培养各有特点的年轻学者;是一个有着远见卓识的管理者。他的学生为人做事风格迥异,但都年轻有为,例如追求完美的迈克尔·柯林斯和寻求简单美的艾克尔·*。大师之所以能成为大师,肯定有着一些优秀的品质和追求。
第***章《布隆过滤器》:判断一个元素是否在一个集合当中时,用到了布隆过滤器,存储量小而且计算快速。其原理是:建立一个很长的二进制,将每个元素通过随机数产生器产生一些信息指纹,再将这些信息指纹映射到一些自然数上,最后在建立的那个很长的二进制上把这些自然数的位置都置为1。布隆过滤器的不足之处是它可能把不在集合中的元素错判成集合中的元素,但在某些条件下这个概率是很小的,补救措施是可以建立一个小的白名单,存储那些可能误判的元素。布隆过滤器背后的数学原理在于完全随机的数字其冲突的可能性很小,可以用很少的空间存储大量的信息,并且由于只进行简单的算术运算,因此速度非常快。《编程珠玑》中第一章的那个例子就是布隆过滤器的思想。开阔思维,寻找更好更简单的方法。
第***章《马尔科夫链的扩展——贝叶斯网络》:贝叶斯网络是马尔科夫链的扩展,由简单的线性链式关系扩展为网络的关系,但贝叶斯网络仍然假设每一个状态只与它直接相连的状态相关。确定贝叶斯网络的拓扑结构和各个状态之间相关的概率也需要训练。在词分类中,可以建立文章、主题和关键词的贝叶斯网络,用来得到词的分类。贝叶斯网络的训练包括确定拓扑结构和转移概率,比较复杂,后者可以参考最大熵训练的方法。贝叶斯网络导出的模型是非常复杂的。
第二十五章《条件随机场和句法分析》:句法分析是分析出一个句子的句子结构,对于不规则的句子,对其进行深入的分析是很复杂的,而浅层的句法分析在很多时候已经可以满足要求了。条件随机场就是进行浅层句法分析的有效的数学模型。条件随机场与贝叶斯网络很像,不用之处在于,条件随机场是无向图,而贝叶斯网络是有向图。条件随机场的训练很复杂,简化之后可以参考最大熵训练的方法。对于条件随机场的详细参数及原理还不理解。
第二十六章《维特比和他的维特比算法》:维特比算法是一个动态规划算法,凡是使用隐马尔科夫模型描述的问题都可以用它来解码。维特比算法采用逐步渐进的方法,计算到每步的最短距离,到下步的最短距离只用接着本步的计算即可,相比穷举法,**缩短了计算的时间,并且基本可以实现实时的输出,这看似简单,但在当时确是很了不起的。维特比并不满足停留在算法本身,他将算法推广出去,并应用到了实际中,创立了高通公司,成为了世界上第二富有的数学家。高通公司在第二代移动通信中并不占很强的市场地位,而其利用CDMA技术霸占了3G的市场,可见远见的洞察力是多么的重要。
第二十七章《再谈文本分类问题——期望最大化算法》:该章讲的其实就是K均值聚类问题,设置原始聚类中心,然后不断迭代,直至收敛,将每个点分到一个类中。其实隐马尔科夫模型的训练和最大熵的训练都是期望最大化算法(EM)。首先,根据现有的模型,计算各个观测数据输入到模型中的计算结果,这个过程称为期望值计算过程,或E过程;接下来,重新计算模型参数,以最大化期望值,这个过程称为最大化的过程,或M过程。优化的目标函数如果是个凸函数,则一定有全局最优解,若不是凸函数,则可能找到的是局部最优解。在以后的一些问题求解过程中,应该考虑其是否是EM问题,也可以考虑参考这种思想,不断迭代以优化目标的过程。
第二十八章《逻辑回归和搜索广告》:雅虎和百度的竞价排名广告并不比谷歌的根据广告的预估点击率来客观的推送广告收入多。点击预估率有很多影响因素,一种有效的方法是逻辑回归模型,逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型。其训练方法和最大熵模型相似。同样不是很理解其具体内涵。
第二十九章《各个击破和Google云计算的基础》:分而治之,各个击破是一个很好的方法,Google开发的MapReduce算法就应用了该方法。将一个大任务分成几个小任务,这个过程叫Map,将小任务的结果合并成最终结果,这个过程叫Reduce,该过程如何调度、协调就是工程上比较复杂的事情了。可见大量用到的、真正有用的方法往往简单而又朴实。
附录《计算复杂度》:计算机中复杂度是以O()来表示的,如果一个算法的计算量不超过N的多项式函数,则称算法为多项式函数复杂度的(P问题),是可以计算的。若比N的多项式函数还高,则是非多项式问题,实际上是不可计算的。非多项式问题中一种非确定的多项式问题(简称NP),是科学家研究的焦点,因为现实中好多问题都是NP问题。另外还有NP—Complete问题(NP问题可以在多项式时间内规约到该问题)和NP—Hard问题,对于这两种问题,需要简化找到近似解。
整体上,《数学之美》这本书让我了解了很多文本处理,数据挖掘相关的知识,学到了很多。其中,简单美以及一些科学家的大师风范让我印象深刻!书中提到的一些思想(即道)让我受益匪浅!
《数学之美》读书笔记2
很多人都觉得,数学是一个太高深、太理论的学科,不接近生活,对我们大多数人来说*时也根本用不到,所以没必要去理解数学。但事情真的是这样吗?
其实不然,数学一直渗透在我们生活的各个方面,尤其是在今天这个信息时代,很多简单朴素的数学思想,能发挥一般人很难想象的巨大作用。比如,计算机处理自然语言,用到的最重要工具是统计学的思想;计算机对**内容的分类,依靠的是数学里的余弦定理;而电子电路的基本逻辑,则来源于仅有0和1两个数字的布尔代数。
在《数学之美》里,吴军用自己在工作中使用数学的亲身经历,为我们展现了数学的重要性,以及他对数学之美的理解。吴军是“得到”App专栏《吴军的谷歌方法论》的主理人。曾先后供职于谷歌和腾讯,是著名的.自然语言处理专家和搜索专家。同时,他还是位畅销书作家,除了这本《数学之美》以外,还写过《文明之光》《智能时代》《浪潮之巅》等多本畅销书。
《数学之美》读书笔记3
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道----解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。
第二章《自然语言处理----从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能****的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法---基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型,就可以解决好多机器学习的问题,训练中会涉及到一些经典的算法(维特比算法等)。关于这个模型,没有实际实现过,所以感觉好陌生,只是知道了些概率论讲过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我**你”。贾里克尼教授一生专注学习,最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。
在这章中对于少年时的教育,以下几点值得借鉴:
1、少年时期其实没有必要花那么多时间读书,他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。
2、中学时花大量时间学会的内容,在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。
3、学习(和教育)是一个人一辈子的过程。
4、书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美----布尔代数和搜索引擎的索引》:布尔是19世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1,为了适应索引访问的速度、附加的信息、更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运算。牛顿的一句话“(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的”。做好搜索,最基本的要求是每天分析10-20个不好的搜索结果,积累一段时间才有感觉。有时候,学习、处理问题,可以从不好的方面入手,效果可能更好。
第九章《图论和网络爬虫》:图的遍历分为“广度优先搜索(Breadth-FirstSearch,简称BFS)”和“深度优先搜索(Depth-FirstSearch,简称DFS)。互联网上有几百亿的网页,需要大量的服务器用来下载网页,需要协调这些服务器的任务,这就是网络设计和程序设计的艺术了。另外对于简单的网页,没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过(如果记录每个网页的url,数量太多,这里可以用后面提到的信息指纹,只需要一个很多位的数字即可),避免重复下载。另外,在图论出现的很长一段时间里,实际需求的图只有几千个节点,那时图的遍历很简单,人们都没有怎么专门研究这个问题,随着互联网的出现,图的遍历一下子有了用武之地,很多数学方法就是这样,看上去没有什么用途,等到具体的应用出来了一下子开始派上大用场了,这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单,但里面的每个东西都可能是一个复杂的东西,需要很好的设计。
第十章《PageRank----Google的**表决式网页排名技术》:搜索返回了成千上万条结果,如何为搜索结果排名?这取决与两组信息:关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量,该算法的思想是如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难,可是当时只有佩奇和布林想到了,为什么呢?
第十一章《如何确定网页和查询的相关性》:构建一个搜索引擎的四个方面:如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF,TF衡量一个词在一个网页中的权重,即词频。IDF衡量一个词本身的权重,对主题的预测能力。一个查询和该网页的相关性公式由词频的简单求和变成了加权求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN。看似复杂的搜索引擎,里面的原理竟是这么简单!
第十二章《地图和本地搜索的最基本技术——有限状态机和动态规划》:地址的解析依靠有限状态机,当用户输入的地址不太标准或有错别字时,希望进行模糊匹配,提出了一种基于概率的有限状态机。通用的有限状态机的程序不是很好写,要求很高,建议直接采用开源的代码。图论中的动态规划问题可以用来解决两点间的最短路径问题,可以将一个“寻找全程最短路线”的问题,分解成一个个寻找局部最短路线的小问题。有限状态机和动态规划问题需要看相关的算法讲解,才能深入理解,目前对其并未完全理解。
第十三章《GoogleAK-47的设计者——阿米特·辛格博士》:辛格坚持选择简单方案的一个原因是容易解释每一个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。辛格要求对于搜索质量的改进方法都要能说清楚理由,说不清楚理由的改进即使看上去有效也不会采用,因为这样将来可能是个隐患。辛格非常鼓励年轻人要不怕失败,大胆尝试。遵循简单的哲学。
第十四章《余弦定理和**的分类》:将**根据词的TF-IDF值组成**的特征向量,然后根据向量之间的余弦距离衡量两个特征之间的相似度,将**自动聚类。另外根据词的不同位置,权重应该不同,比如标题的词权重明显应该大点。大数据量的余弦计算也要考虑很多简化算法。
第十五章《矩阵运算和文本处理中的两个分类问题》:将大量的文本表示成文本和词汇的矩阵,然后对该矩阵进行奇异值SVD分解,可以得到隐含在其中的一些信息。计算余弦相似度的一次迭代时间和奇异值分解的时间复杂度在一个数量级,但计算余弦相似度需要多次迭代。另外,奇异值分解的一个问题是存储量大,而余弦定理的聚类则不需要。奇异值分解得到的结果略显粗糙,实际工作中一般先进行奇异值分解得到粗分类结果,在利用余弦计算得到比较精确地结果。我觉得这章讲的SVD有些地方不是很清楚,已向吴军老师请教了,等待回信。
第十六章《信息指纹及其应用》:信息指纹可以作为信息的唯一标识。有很多信息指纹的产生方法,互联网加密要使用基于加密的伪随机数产生器,常用的算法有MD5或者SHA-1等标准。信息指纹可以用来判定集合相同或基本相同。YouTobe就用信息指纹来反盗版。128位的指纹,1.8*10^19次才可能重复一次,所以重复的可能性几乎为0。判定集合是否相同,从简单的逐个比对到利用信息指纹,复杂度降低了很多很多。启发我们有时候要用变通的思想来解决问题。
第十七章《由电视剧《**》所想到的——谈谈密码学的数学原理》:RSA加密算法,有两个完全不同的钥匙,一个用于加密,一个用于解密。该算法里面蕴含着简单但不好理解的数学思想。信息论在密码设计中的应用:当密码之间分布均匀并且统计**时,提供的信息最少。均匀分布使得敌人无从统计,而统计**能保证敌人即使知道了加密算法,也不能破译另一段密码。
第十八章《闪光的不一定是金子——谈谈搜索引擎反作弊问题》:把搜索反作弊看成是通信模型,作弊当做是加入的噪声,解决噪声的方法:从信息源出发,增强排序算法的抗干扰能力;过滤掉噪声,还原信息。只要噪声不是完全随机并且前后有相关性,就可以检测到并消除。作弊者的方法不可能是随机的,且不可能一天换一种方法,及作弊是时间相关的。因此在搜集一段时间的作弊信息后,就可以将作弊者抓出来,还原原有的排名。一般作弊都是针对市场份额较大的搜索引擎做的,因此,一个小的搜索引擎作弊少,并不一定是它的反作弊技术好,而是到它那里作弊的人少。
第十九章《谈谈数学模型的重要性》:早期的行星运行模型用大圆套小圆的方法,精确地计算出了所有行星运行的轨迹。但其实模型就是简单的椭圆而已。一个正确的数学模型应该在形式上是简单的;一个正确的模型可能开始还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;大量准备的数据对研发很重要;正确的模型可能受到噪声干扰,而显得不准确,这是不应该用一种凑合的修正方法来弥补它,要找到噪声的根源,这也许能通往重大的发现。
第二十章《不要把鸡蛋放在一个篮子里——谈谈最大熵模型》:对一个随机事件预测时,当各种情况概率相等时,信息熵达到最大,不确定性最大,预测的风险最小。最大熵模型的训练非常复杂,需要时查看资料做进一步的理解。
第二十一章《拼音输入法的数学原理》:输入法经历了以自然音节编码,到偏旁笔画拆字输入,再回归自然音节输入的过程。任何事物的发展,螺旋式的回归不是简单的重复,而是一种升华。输入法的速度取决于编码的场地*寻找这个键的时间。传统的双拼,记住编码太难,寻找每个键的时间太长,并且增加了编码上的歧义。根据香农第一定理可以计算理论上每个汉字的*均最短码长。全拼不仅编码*均长度较少,而且根据上下文的语言模型可以很好的解决歧义问题。利用统计语言模型可是实现拼音转汉字的有效算法,而且可以转换为动态规划求最短路径问题。如今各家输入法的效率基本在一个量级,进一步提升的关键就在于建立更好的语言模型。可以根据每个用户建立个性化的语言模型。输入的过程本身就是人和计算机的通信,好的输入法会自觉或者不自觉的的遵循通信的数学模型。要做出最有效的输入法,应该自觉使用信息论做指导。
第二十二章《自然语言处理的教父马库斯和他的优秀弟子们》:将自然语言处理从基于规则到基于统计,贡献最大的两个人,一个是前面介绍的贾里尼克教授,他是一个开创性任务;另一个是将这个方法发扬光大的米奇·马库斯。马库斯的贡献在于建立了造福全世界研究者的宾夕法尼亚大学LDC语料库以及他的众多优秀弟子。马库斯的影响力很大程度上是靠他的弟子传播出去的。马库斯教授有很多值得钦佩的地方:给予他的博士研究生自己感兴趣的课题的**,高屋建瓴,给学生关键的指导;宽松的管理方式,培养各有特点的年轻学者;是一个有着远见卓识的管理者。他的学生为人做事风格迥异,但都年轻有为,例如追求完美的迈克尔·柯林斯和寻求简单美的艾克尔·*。大师之所以能成为大师,肯定有着一些优秀的品质和追求。
第***章《布隆过滤器》:判断一个元素是否在一个集合当中时,用到了布隆过滤器,存储量小而且计算快速。其原理是:建立一个很长的二进制,将每个元素通过随机数产生器产生一些信息指纹,再将这些信息指纹映射到一些自然数上,最后在建立的那个很长的二进制上把这些自然数的位置都置为1。布隆过滤器的不足之处是它可能把不在集合中的元素错判成集合中的元素,但在某些条件下这个概率是很小的,补救措施是可以建立一个小的白名单,存储那些可能误判的元素。布隆过滤器背后的数学原理在于完全随机的数字其冲突的可能性很小,可以用很少的空间存储大量的信息,并且由于只进行简单的算术运算,因此速度非常快。《编程珠玑》中第一章的那个例子就是布隆过滤器的思想。开阔思维,寻找更好更简单的方法。
第***章《马尔科夫链的扩展——贝叶斯网络》:贝叶斯网络是马尔科夫链的扩展,由简单的线性链式关系扩展为网络的关系,但贝叶斯网络仍然假设每一个状态只与它直接相连的状态相关。确定贝叶斯网络的拓扑结构和各个状态之间相关的概率也需要训练。在词分类中,可以建立文章、主题和关键词的贝叶斯网络,用来得到词的分类。贝叶斯网络的训练包括确定拓扑结构和转移概率,比较复杂,后者可以参考最大熵训练的方法。贝叶斯网络导出的模型是非常复杂的。
第二十五章《条件随机场和句法分析》:句法分析是分析出一个句子的句子结构,对于不规则的句子,对其进行深入的分析是很复杂的,而浅层的句法分析在很多时候已经可以满足要求了。条件随机场就是进行浅层句法分析的有效的数学模型。条件随机场与贝叶斯网络很像,不用之处在于,条件随机场是无向图,而贝叶斯网络是有向图。条件随机场的训练很复杂,简化之后可以参考最大熵训练的方法。对于条件随机场的详细参数及原理还不理解。
第二十六章《维特比和他的维特比算法》:维特比算法是一个动态规划算法,凡是使用隐马尔科夫模型描述的问题都可以用它来解码。维特比算法采用逐步渐进的方法,计算到每步的最短距离,到下步的最短距离只用接着本步的计算即可,相比穷举法,**缩短了计算的时间,并且基本可以实现实时的输出,这看似简单,但在当时确是很了不起的。维特比并不满足停留在算法本身,他将算法推广出去,并应用到了实际中,创立了高通公司,成为了世界上第二富有的数学家。高通公司在第二代移动通信中并不占很强的市场地位,而其利用CDMA技术霸占了3G的市场,可见远见的洞察力是多么的重要。
第二十七章《再谈文本分类问题——期望最大化算法》:该章讲的其实就是K均值聚类问题,设置原始聚类中心,然后不断迭代,直至收敛,将每个点分到一个类中。其实隐马尔科夫模型的训练和最大熵的训练都是期望最大化算法(EM)。首先,根据现有的模型,计算各个观测数据输入到模型中的计算结果,这个过程称为期望值计算过程,或E过程;接下来,重新计算模型参数,以最大化期望值,这个过程称为最大化的过程,或M过程。优化的目标函数如果是个凸函数,则一定有全局最优解,若不是凸函数,则可能找到的是局部最优解。在以后的一些问题求解过程中,应该考虑其是否是EM问题,也可以考虑参考这种思想,不断迭代以优化目标的过程。
第二十八章《逻辑回归和搜索广告》:雅虎和百度的竞价排名广告并不比谷歌的根据广告的预估点击率来客观的推送广告收入多。点击预估率有很多影响因素,一种有效的方法是逻辑回归模型,逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型。其训练方法和最大熵模型相似。同样不是很理解其具体内涵。
第二十九章《各个击破和Google云计算的基础》:分而治之,各个击破是一个很好的方法,Google开发的MapReduce算法就应用了该方法。将一个大任务分成几个小任务,这个过程叫Map,将小任务的结果合并成最终结果,这个过程叫Reduce,该过程如何调度、协调就是工程上比较复杂的事情了。可见大量用到的、真正有用的方法往往简单而又朴实。
附录《计算复杂度》:计算机中复杂度是以O()来表示的,如果一个算法的计算量不超过N的多项式函数,则称算法为多项式函数复杂度的(P问题),是可以计算的。若比N的多项式函数还高,则是非多项式问题,实际上是不可计算的。非多项式问题中一种非确定的多项式问题(简称NP),是科学家研究的焦点,因为现实中好多问题都是NP问题。另外还有NP-Complete问题(NP问题可以在多项式时间内规约到该问题)和NP-Hard问题,对于这两种问题,需要简化找到近似解。
整体上,《数学之美》这本书让我了解了很多文本处理,数据挖掘相关的知识,学到了很多。其中,简单美以及一些科学家的大师风范让我印象深刻!书中提到的一些思想(即道)让我受益匪浅!
《数学之美》读书笔记4
这本书一共31章,主要介绍了这些数学方法:统计方法、统计语言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析、维特比算法、各个击破算法等。从第一章开始其明了幽默的语言就深深的吸引了我,让我觉得如果早一点看这本书,也许数学之于我就是另一番天地。
第一章里作者从原始人类的通信方式开始入手,人类最早利用声音进行的通信依赖于开篇给出的"编码-传输-解码"的基本原理,指出原始人的通信方式和今天的通信方式没什么不同,这世界上近现代最普遍的原理大部分都在人类发展的历史上被无意识的使用着。
第六章信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的'大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
这本书里也能找到不少在学的课程知识,如大学专业课里,数电总是要比模电简单不少,而自然界里大部分的信号都属于模拟信号。所谓模拟信号,是指从时间和数值两种维度上看来都是连续变化的信号。在实际电路中,模/数转换是一个很重要的过程,将预处理的模拟信号经过模/数变换为数字信号,然后进行数字信号处理。而数字化处理有很多优点,比如功能强大、抗干扰能力强、易于传输等。
简而言之,如果没有数学,就没有数字信号处理和传输的概念,而数字信号传输在当下大规模的集成电路里是必不可少的,这是通信成功的基本要求。
作者把生活中遇到的复杂的问题,以简单清晰,直观的模型或者公式展现出来。我们可能过于注意生活中的种种奇妙现象,往往忽略了追求其理论逻辑的演绎,而这也是大部分问题的主要根源。
罗素曾经说过:"数学,如果正确地看,不但拥有真理,而且也具有至高的美";爱因斯坦也曾说过:"纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。"数学在所有科学领域起着基础和根本的作用。"哪里有数,哪里就有美".在这里,我也想把《数学之美》真诚推荐给每一位对自然、科学、生活有兴趣有热情的朋友,不管你是从事职业,读一读它,会让你受益良多。
吴军老师在《数学之美》中提到:"这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余".回到我们日常的生活中,需要学习的东西、技术太多太多,如果一味地只为去追技术的脚步,那么我们也会很累很累。然而基本的原理却是没有怎么变化的。只见森林,不见树木,难免迷失;站在高处向下看,也许我们一直看不到底,但是站在底处却是可以看见底的。
《数学之美》读书笔记5
我是在读了吴军博士的《浪潮之巅》之后,发现推荐了《数学之美》这本书。我到豆瓣读书上看了看评价,就果断在当当上下单买了一本研读。本来我以为这是一本充满各种数学专业术语的书,读后让我非常震撼的是吴军博士居然能用非常通俗的语言将自然语言处理等高深理论解释的相当简单。在李开复博士之后,吴军博士又成为了目前备受瞩目的具有深厚技术背景的作家。对于我来说,读这本书有扫盲的功效,让我知道了很多以前不知道的东西。我的想法是在研究生阶段,不只局限于导师的研究方向,通过更加广泛的涉猎知识,去寻找一个自己喜欢的研究领域。如果找到了这样一个领域,那么我就读博士。如果没有的话,那么我想还是工作算了。
1、学科之间的联系是如此的重要
全书主要是围绕着吴军博士所研究的自然语言处理方向来讲述一些应用在这个研究领域的数学知识,用了很大篇幅讲解了将通信的原理应用到自然语言处理上所取得的'巨大成功。以前学习计算机网络的时候,学过一个香农定理。对香农的认识就从香农定理开始,因为考研会考相关的计算题。看了这本书才知道,香农的《信息论》对今天的影响真的是不可估量。通过这样一个过程,我也对以前的本科学校的学科建设产生了一些忧虑。对于培养计算机人才来说,无论是培养应用型人才,还是培养研究型人才,都应该与电子、通信有一定的交叉,这样对学生思考问题的启发与视野的开阔有着重要的作用。计算机本身就是从电子、通信、数学等学科中抽出来的新兴的学科,在发展了多年之后,我们发现它仍然需要继承一些传统。回想自己的本科四年,上的更多的课时
语言类、技术类的课程,这些课程的确对提升学生的就业有很大帮助。但是我想说的是,一个忽视数学基础、学科交叉的学校,他无法成为一所**的一流大学。作为一个母校培养的学生,我深知**的阻力与困难,但是我希望母校的计算机学院能越办越好。我们现在已经培养出很多高薪优秀的技术人才,我希望将来也能培养出更多的研究型人才。
2、看起来很牛的东西却用着难以置信的简单数学原理
在整本书中让我最为印象深刻的是解释Google搜索的原理,居然就是简单的布尔代数运算。这个的确让我大跌眼镜,我一直认为搜索时一个非常复杂而庞大的问题,其数学原理也是相当高深的,但是吴军博士的解释让我大开眼界。与此同时也知道了Google为什么牛,牛在哪了。搜索的原理虽然非常简单,但是搜索是一个需要对海量数据进行操作的工作。Google在海量数据的处理方面的确是相当先进的,MapReduce、BigTable等等一些技术的发明与应用使得Google在搜索上无出其右。目前分布式存储、分布式计算、数据仓库与存储等研究领域近些年来的大热也说明Google在引领研究方向上的超凡本领。
3、感谢概率老师的教诲
在大二的时候,有一个在我们学生中声望很高的概率老师,他在课程即将结束的时候跟我们说我们将的是前几章,这些事概率论与数理统计的基础。对于你们计算机的学生来时,后面的章节才是最有用的,以后一定要好好的研究,弄上一两个在你的毕业设计上就会让你毕业设计提升一个档次,有可能验收你毕业设计的老师也不懂。我当时对他的话没有特别在意,我只关心期末考试要考哪些题目,因为我那个学期的概率课基本上都在睡觉,只有他讲笑话的时候不睡。我看《数学之美》后发现马尔科夫链、贝叶斯网络之后,对以前的概率老师充满无限的敬意。我发现我们再本科阶段学习的《高等数学》、《线性代数》、《概率论与数理统计》在计算机学科应用较多的要数概率论与数理统计,还有一门我学的不好的《离散数学》在计算机中也是有着举足轻重的地位。我在看米歇尔的《机器学习》时也发现很多熟悉的概率论与数理统计的知识,这让我不得不开始考虑重新弥补自己的数学短板。我的想法是在研一这一年把概率论与数理统计、线性代数、离散数学尽我最大的努力补一补,希望他们对我今后的学习有所帮助。
4、说说作者吴军博士
吴军博士写的书对于学习计算机的学生来说,读起来有种说不出的亲切感。可能这跟他是技术出身的原因有关,流畅的文笔、质朴的文风也让人读起来很舒服。看**松在优酷上的《晓说》就知道,在硅谷有着众多的华裔工程师,他们很多都来自清华、北大等**的名牌大学,这些人在**实现着自己的梦想。吴军博士也曾是这其中的一员,我非常希望那些像吴军博士一样的牛人们能够写书或者来**的大学做一些演讲、论坛等等,开阔一下我们的视野,传授一下做学问的经验。与此同时,我也在想为什么我们国家那么多优秀的IT人才都去了**。
这个问题在我去苹果公司在东软信息学院**的培训过程中得到了答案,那个南京邮电的老师讲了讲*为什么不像**那么有创造力。我们*人并不缺乏创造力,很多时候是我们所处的外部环境恰恰阻碍了创新。我想那么多优秀的清华北大学子纷纷到大洋彼岸的**,正是被**开放的学术环境、创新氛围所吸引,每个人都有自己的梦想,他们去**也是为了能实现自己的梦想。以前都觉得他们是不爱国,现在长大了,对于这个问题看得更清楚了一点。
我想说我们的祖国在经历了**开放30多年的飞速发展之后,目前正处于一个关键和脆弱的时期。我们靠着人口红利取得了巨大的成就,我们能不能凭借人才红利取得更大的成就还是未知。希望有更多的人才能像李开复博士、吴军博士那样,为我们这个民族青年的成长和国家发展做出贡献。
《数学之美》读书笔记6
读完本书,第一感受:次奥!原来数学如此多的原理模型概念都可以用去解决各种IT技术问题啊。特别是语言识别和自然语言处理这类问题完全就是建立在数学原理之上的。总之,这本书就是用非常深入浅出的话去说明如何用数学方法去解决计算机的各种工程问题。这是一本讲道,而不是术的书。 要完全读懂这本书,我觉得至少需要掌握这三门课:高等数学,离散数学,还有概率论与数理统计。唉..我当初数学学得太水了,还挂了高数啊...有好的概念没看懂,以后有时间在好好看吧。如果想搞计算机研究的话,数学基础必不可少,别总在抱怨各种数学课上的东西一辈子都用不着。
发现作者对人类自然发展的认识非常深,其从语言,文字,数学的产生发展,信息的传播记录得出了这个结论:信息的产生传播接收反馈,和今天最先进的通信在原理上没有任何差别。就算是科学上最高深的技术,那也是模拟我们生活中的一些基本原理。
我们今天使用的十进制,就是我们扳手指扳了十次,就进一次位。而玛雅文明他们数完了手指和脚指才开始进位,所以他们用的是二十进制。实际上*数字是古印度人发明的,只是欧洲人不知道这些数字的真正发明人是古印度,而就把这功劳该给了“二道贩子”*人。
语言的数学本质
任何一种语言都是一种编码方式,比如我们把一个要表达的意思,通过语言一句话表达出来,就是利用编码方式对头脑中的信息做了一次编码,编码的结果就是一串文字,听者则用这语言的解码方法获得说话者要表达的信息。
自然语言处理模型
计算机是很笨的,他们唯一会做的就是计算。自然语言处理在数学模型上是基于统计的,说一个句子是否合理,就看看他出现的可能性大小如何,可能性就是用概率来衡量,比如一个句子,出现的概率为1/10^10,另一个句子出现的概率为1/10^20,那么我们就可以说第一个句子比第二个句子更加合理。当然这要求有足够的观测值,他有大数定理在背后**。
最早的中文分词方法
这句话:“同学们呆在图书馆看书”,如何分词?应该是这样:同学们/呆在/图书馆/看书.最先的方法是北航一老师提出的查字典方法,就是把句子从左道右扫描一遍,遇到字典里面出现的词就标示出来,遇到复合词如(**大学)就按照最长的分词匹配,遇到不认识的字串就分割成单个字,于是中文的分词就完成了。但是这只能解决78成的分词问题,但是“像发展*家”这种短语它是分不出来的。后来**用基于统计语言模型方法才解决了。
隐含马可夫模型(没这么看懂)
一直被认为是解决打多数自然语言处理问题最为快速有效的方法,大致意思是:随机过程中各个状态的概率分布,只与他的前一个状态有关。比如对于天气预报,我们只假设今天的气温只与昨天有关而与前天没有关系,这虽然不完美,但是以前不好解决的问题都可以给出近视值了。
一个让我印象深刻的观点:
小学生和中学生其实没有必要花那么多时间去读书,其觉得最主要的是孩子们的社会经验,生活能力,和那时候树立起来的志向,这将帮助他们一生。而中学生阶段花很多时间比同伴多读的课程,在大学以后可以用非常短的时间就可以读完。因为在大学阶段,人的理解能力要强很多,比如中学要花500小时才能搞明白的内容,大学可能花100小时就搞定了。学习和教育是一个人一辈子的事情,很多中学成绩好的人进入大学后有些就表现不太好了,要有不断学习的动力才行。
余弦定理和**分类
我在新浪干过一年多**,这篇认真看了一篇,很吃惊原理cos x与**分析也有关系啊。google的**服务是由计算机自动整理分类的。而传统的**如***站是让编辑读懂**,找到主题,再分类分级别的,真苦逼啊...计算机自动分类原理是这样:如一篇**有10000个词,组成一个万维向量,这个向量就**这篇**,可以通过某种算法表达这个**主题的类型,如果两个向量的方向一致,说明对应的**用词一致,方向可用夹角表示,夹角可用余弦定理表示,所以当夹角的余弦值接近于1时,这两篇**就可以归为一类了。
没看懂的东西:
布尔代数:布尔代数把逻辑学和数学合二为一,给了我们一个全新的视角看世界...
网络爬虫的基本原来是利用了图论的广度优先搜索和深度优先搜索...
搜索引擎的结果排名用了稀疏矩阵的计算...
地图最基本的计算是利用了有限状态机和图论的最短路径...
密码学原理,最大熵模型,拼音输入法的数学模型,布隆过滤器,贝叶斯网络等等...
任何事物都有它的发展规律,当我们认识了规律后,应当在生活工作中遵循规律,希望大家透过IT规律的认识,可 以举一反三的总结学习认识规律,这样有助于自己的境界提升一个层次。
任何问题总是能找到相应的准确数学模型,一个正确的数学模型在形式上应当是简单的,一个好的方法在形式上应当也是简单的。简单才是美。
《数学之美》读书笔记7
《数学之美》,一个从事多年工作的谷歌研究员眼中的数学。令我大饱眼福的是,大学里面的数学知识竟能如此广泛运用到了计算机行业中。
在语音识别、翻译,还有密码学领域,有着许多基于概率统计的模型和思想。当然,贝叶斯公式是基础,应用到隐含马尔科夫链模型,神经网络模型。
在搜索中,一些相关性的计算,无不用到了概率的知识。在**分类中,用到了一些有关矩阵特征值、相似对角化的知识。当然,在图像处理方面,矩阵变换可谓是无处不在。另外,在识别方面,有一些通信模型,涉及到了信道、误码率、信息熵。
最近刚开学也没什么事,所以就想随便找几本书看一下,但最好别是那种太艰深晦涩的书。8月份一直到现在,吴军写的这本12年5月出版的《数学之美》一直盘踞京东、亚马逊等各大网上商城科技类图书的榜首,当然,还有早些时候出版的《浪潮之巅》也排在很靠前的位置。心想市场的力量应该能帮我挑出好书吧,于是就从图书馆借了一本来,一直到今天晚上把它给看完了。
因此想写一点东**总结、反思一下,反正刚开完班会也没什么事干。
写在前面的建议:如果你不讨厌数学的话,强烈推荐这本书,网上也可以下到电子版,不过阅读感觉上还是很不一样的。
废话就不多说了,《数学之美》其实是一本科普类的读物,所面向的是接受过普通高等教育的人,完全不需要在特定领域有很深的造诣就可以看懂,大概懂一点线性代数、概率统计、组合数学、信息论、计算机算法、模式识别最好(虽然列举了这么多,其实有些不懂也没关系……),所以尤其适合信科的人看。内容大部分是和人工智能、计算机相关的,这并非我所学的专业,但作者比较擅长将看似复杂的原理用简明的语言表达出来,所以可读性还是很好的。
吴军是清华大学毕业的,之前任职于Google,后来到了腾讯,这些文章都是发表在Google黑板报上的,后来经过了重写,所以网上下载的和书本内容有所差异。由于吴军本人是研究自然语言处理和语音识别的,所以统计语言模型的东西可能会多一点,不过我觉得这丝毫不妨碍全书数学之美的展现……感觉收获还是挺多的,知识上的有一些,但更多还是思维方式上的。作者举了很多例子试图让人明白很多看似复杂的高科技背后,基本原理其实是出乎意料简单的(当然,必须承认第一个想到这些方法的人还是非常了不起的……)。比如高准确率的机器翻译,看上去好像是计算机能够理解各国语言,隐藏在背后的却是很多具有大学理科**的人都非常清楚的统计模型和概率模型;再比如拼音输入法的数学原理,早期的研究主要集中在缩短*均编码长度,比如曾经流行一时的五笔输入法,而现今真正实用的输入法却是有很多信息冗余、编码长度比较长的拼音输入法,作者从信息论和市场的角度做了简单的阐述;又比如**的自动分类,许多非IT领域的人可能会认为计算机可以读懂**并进行分类,而实际上只是特征向量的抽取、多维空间中向量夹角的计算,非常非常简单,但凡学过一点线性代数的人绝对是一看就懂的……当然,完美的实现还需要考虑很多细节和现实的情况,但这并不是这本书所关注的地方,数学之美在于其简洁而不是繁琐。
除了对于具体信息技术的剖析之外,作者还花了很大篇幅来讲一些杰出人士的成长过程,特别是把这些人的成长经历和*学生的成长经历作对比。虽然作者并没有明说,但字里行间多少流露出对于*高等教育以及很多*企业的批评,一是教育的功利性,缺乏宽松的**思考的环境,即使学了一堆理论也难有用武之地,自然也就缺乏创新性的成果;二是*企业的短视,大部分都不舍得在新框架开发上投资,而是坐享学术界和**企业的研究成果。
总结一下呢,《数学之美》事实上不能带给你编程能力的提升,也没法让人的数学水*有显着的提升,但它在很大程度上让你跳出教科书式的繁琐细节的束缚,能够从更宏观的角度来思考信息世界背后的数学引擎的运行原理,让人明白看似很高级、复杂的东西背后其实并不如我们所想象的那样复杂,而我们所学的“枯燥”的数学真的可以“四两拨千斤”,改变亿万人的生活。
《数学之美》读书笔记8
《数学之美》是一本领域相关的数学概念书,生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识,可以作为数据挖掘、文本检索的入门普及书。另外,就像作者吴军老师提到的,关键是要从中学到道----解决问题的方法,而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。
下面记录一下自己读这本书的一些感想:
第一章《文字和语言vs数字和信息》:文字和语言中天然蕴藏着一些数学思想,数学可能不仅仅的是一门非常理科的知识,也是一种艺术。另外,遇到一个复杂的问题时,可能生活中的一些常识,一些简单的思想会给你带来解决问题的灵感。
第二章《自然语言处理----从规则到统计》:试图模拟人脑处理语言的模式,基于语法规则,词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度,而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程,找到统计的方法经历了20多年,非常庆幸我们的前辈已经帮我们找到了正确的方法,不用我们再去苦苦摸索。另外,这也说明在发现真理的过程中是充满坎坷的,感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃,真正的成长是在解决问题的过程中。事情不可能****的,这是自然界的普遍真理吧!
第三章《统计语言模型》:自然语言的处理找到了一种合适的方法---基于统计的模型,概率论的知识开始发挥作用。二元模型、三元模型、多元模型,模型元数越多,计算量越大,简单实用就是最好的。对于某些不出现或出现次数很少的词,会有零概率问题,这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用,现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话:数学的魅力就在于将复杂的问题简单化。
第四章《谈谈中文分词》:中文分词是将一句话分成一些词,这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词,如今的中文分词算是一个已经解决的问题。然而,针对不同的系统、不同的要求,分词的粒度和方法也不尽相同,还是针对具体的问题,提出针对该问题最好的方法。没有什么是绝对的,掌握其中的道才是核心。
第五章《隐马尔科夫模型》:隐马尔科夫模型和概率论里面的马尔科夫链相似,就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型,就可以解决好多机器学习的问题,训练中会涉及到一些经典的算法(维特比算法等)。关于这个模型,没有实际实现过,所以感觉好陌生,只是知道了些概率论讲过的原理而已。
第六章《信息的度量和作用》:信息论给出了信息的度量,它是基于概率的,概率越小,其不确定性越大,信息量就越大。引入信息量就可以消除系统的不确定性,同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量,这一点与热力学中的熵概念相同,看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的,要学会借鉴其他知识。
第七章《贾里尼克和现代语言处理》:贾里尼克是为世界级的大师,不仅在于他的学术成就,更在于他的风范。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”,这很像听到的一句话“我不赞同你,但我**你”。贾里克尼教授一生专注学习,最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。
在这章中对于少年时的教育,以下几点值得借鉴:
1、少年时期其实没有必要花那么多时间读书,他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。
2、中学时花大量时间学会的内容,在大学用非常短的时间就可以读完,因为在大学阶段,人的理解力要强很多。
3、学习(和教育)是一个人一辈子的过程。
4、书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
第八章《简单之美----布尔代数和搜索引擎的索引》:布尔是19世纪英国的一位中学教师,但他的公开身份是啤酒商,提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1,为了适应索引访问的速度、附加的信息、更新要快速,改进了索引的建立,但原理上依然简单,等价于布尔运算。牛顿的一句话“(人们)发觉真理在形式上从来是简单的,而不是复杂和含混的”。做好搜索,最基本的要求是每天分析10-20个不好的搜索结果,积累一段时间才有感觉。有时候,学习、处理问题,可以从不好的方面入手,效果可能更好。
第九章《图论和网络爬虫》:图的遍历分为“广度优先搜索(Breadth-FirstSearch,简称BFS)”和“深度优先搜索(Depth-FirstSearch,简称DFS)。互联网上有几百亿的网页,需要大量的服务器用来下载网页,需要协调这些服务器的任务,这就是网络设计和程序设计的艺术了。另外对于简单的网页,没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过(如果记录每个网页的url,数量太多,这里可以用后面提到的信息指纹,只需要一个很多位的数字即可),避免重复下载。另外,在图论出现的很长一段时间里,实际需求的图只有几千个节点,那时图的遍历很简单,人们都没有怎么专门研究这个问题,随着互联网的出现,图的遍历一下子有了用武之地,很多数学方法就是这样,看上去没有什么用途,等到具体的应用出来了一下子开始派上大用场了,这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单,但里面的每个东西都可能是一个复杂的东西,需要很好的设计。
第十章《PageRank----Google的**表决式网页排名技术》:搜索返回了成千上万条结果,如何为搜索结果排名?这取决与两组信息:关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量,该算法的思想是如果一个网页被很多其他网页所链接,说明它收到普遍的承认和信赖,那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难,可是当时只有佩奇和布林想到了,为什么呢?
第十一章《如何确定网页和查询的相关性》:构建一个搜索引擎的四个方面:如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF,TF衡量一个词在一个网页中的权重,即词频。IDF衡量一个词本身的权重,对主题的预测能力。一个查询和该网页的相关性公式由词频的简单求和变成了加权求和,即TF1*IDF1+TF2*IDF2+...+TFN*IDFN。看似复杂的搜索引擎,里面的原理竟是这么简单!
第十二章《地图和本地搜索的最基本技术——有限状态机和动态规划》:地址的解析依靠有限状态机,当用户输入的地址不太标准或有错别字时,希望进行模糊匹配,提出了一种基于概率的有限状态机。通用的有限状态机的程序不是很好写,要求很高,建议直接采用开源的代码。图论中的动态规划问题可以用来解决两点间的最短路径问题,可以将一个“寻找全程最短路线”的问题,分解成一个个寻找局部最短路线的小问题。有限状态机和动态规划问题需要看相关的算法讲解,才能深入理解,目前对其并未完全理解。
第十三章《GoogleAK-47的设计者——阿米特·辛格博士》:辛格坚持选择简单方案的一个原因是容易解释每一个步骤和方法背后的道理,这样不仅便于出了问题时查错,而且容易找到今后改进的目标。辛格要求对于搜索质量的改进方法都要能说清楚理由,说不清楚理由的改进即使看上去有效也不会采用,因为这样将来可能是个隐患。辛格非常鼓励年轻人要不怕失败,大胆尝试。遵循简单的哲学。
第十四章《余弦定理和**的分类》:将**根据词的TF-IDF值组成**的特征向量,然后根据向量之间的余弦距离衡量两个特征之间的相似度,将**自动聚类。另外根据词的不同位置,权重应该不同,比如标题的词权重明显应该大点。大数据量的余弦计算也要考虑很多简化算法。
第十五章《矩阵运算和文本处理中的两个分类问题》:将大量的文本表示成文本和词汇的矩阵,然后对该矩阵进行奇异值SVD分解,可以得到隐含在其中的一些信息。计算余弦相似度的一次迭代时间和奇异值分解的时间复杂度在一个数量级,但计算余弦相似度需要多次迭代。另外,奇异值分解的一个问题是存储量大,而余弦定理的聚类则不需要。奇异值分解得到的结果略显粗糙,实际工作中一般先进行奇异值分解得到粗分类结果,在利用余弦计算得到比较精确地结果。我觉得这章讲的SVD有些地方不是很清楚,已向吴军老师请教了,等待回信。
第十六章《信息指纹及其应用》:信息指纹可以作为信息的唯一标识。有很多信息指纹的产生方法,互联网加密要使用基于加密的伪随机数产生器,常用的算法有MD5或者SHA-1等标准。信息指纹可以用来判定集合相同或基本相同。YouTobe就用信息指纹来反盗版。128位的指纹,1.8*10^19次才可能重复一次,所以重复的可能性几乎为0。判定集合是否相同,从简单的逐个比对到利用信息指纹,复杂度降低了很多很多。启发我们有时候要用变通的思想来解决问题。
第十七章《由电视剧《**》所想到的——谈谈密码学的数学原理》:RSA加密算法,有两个完全不同的钥匙,一个用于加密,一个用于解密。该算法里面蕴含着简单但不好理解的数学思想。信息论在密码设计中的应用:当密码之间分布均匀并且统计**时,提供的信息最少。均匀分布使得敌人无从统计,而统计**能保证敌人即使知道了加密算法,也不能破译另一段密码。
第十八章《闪光的不一定是金子——谈谈搜索引擎反作弊问题》:把搜索反作弊看成是通信模型,作弊当做是加入的噪声,解决噪声的方法:从信息源出发,增强排序算法的抗干扰能力;过滤掉噪声,还原信息。只要噪声不是完全随机并且前后有相关性,就可以检测到并消除。作弊者的方法不可能是随机的,且不可能一天换一种方法,及作弊是时间相关的。因此在搜集一段时间的作弊信息后,就可以将作弊者抓出来,还原原有的排名。一般作弊都是针对市场份额较大的搜索引擎做的,因此,一个小的搜索引擎作弊少,并不一定是它的反作弊技术好,而是到它那里作弊的人少。
第十九章《谈谈数学模型的重要性》:早期的行星运行模型用大圆套小圆的方法,精确地计算出了所有行星运行的轨迹。但其实模型就是简单的椭圆而已。一个正确的数学模型应该在形式上是简单的;一个正确的模型可能开始还不如一个精雕细琢过的错误模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去;大量准备的数据对研发很重要;正确的模型可能受到噪声干扰,而显得不准确,这是不应该用一种凑合的修正方法来弥补它,要找到噪声的根源,这也许能通往重大的发现。
第二十章《不要把鸡蛋放在一个篮子里——谈谈最大熵模型》:对一个随机事件预测时,当各种情况概率相等时,信息熵达到最大,不确定性最大,预测的风险最小。最大熵模型的训练非常复杂,需要时查看资料做进一步的理解。
第二十一章《拼音输入法的数学原理》:输入法经历了以自然音节编码,到偏旁笔画拆字输入,再回归自然音节输入的过程。任何事物的发展,螺旋式的回归不是简单的重复,而是一种升华。输入法的速度取决于编码的场地*寻找这个键的时间。传统的双拼,记住编码太难,寻找每个键的时间太长,并且增加了编码上的歧义。根据香农第一定理可以计算理论上每个汉字的*均最短码长。全拼不仅编码*均长度较少,而且根据上下文的语言模型可以很好的解决歧义问题。利用统计语言模型可是实现拼音转汉字的有效算法,而且可以转换为动态规划求最短路径问题。如今各家输入法的效率基本在一个量级,进一步提升的关键就在于建立更好的语言模型。可以根据每个用户建立个性化的语言模型。输入的过程本身就是人和计算机的通信,好的输入法会自觉或者不自觉的的遵循通信的数学模型。要做出最有效的输入法,应该自觉使用信息论做指导。
第二十二章《自然语言处理的教父马库斯和他的优秀弟子们》:将自然语言处理从基于规则到基于统计,贡献最大的两个人,一个是前面介绍的贾里尼克教授,他是一个开创性任务;另一个是将这个方法发扬光大的米奇·马库斯。马库斯的贡献在于建立了造福全世界研究者的宾夕法尼亚大学LDC语料库以及他的众多优秀弟子。马库斯的影响力很大程度上是靠他的弟子传播出去的。马库斯教授有很多值得钦佩的地方:给予他的博士研究生自己感兴趣的课题的**,高屋建瓴,给学生关键的指导;宽松的管理方式,培养各有特点的年轻学者;是一个有着远见卓识的管理者。他的学生为人做事风格迥异,但都年轻有为,例如追求完美的迈克尔·柯林斯和寻求简单美的艾克尔·*。大师之所以能成为大师,肯定有着一些优秀的品质和追求。
第***章《布隆过滤器》:判断一个元素是否在一个集合当中时,用到了布隆过滤器,存储量小而且计算快速。其原理是:建立一个很长的二进制,将每个元素通过随机数产生器产生一些信息指纹,再将这些信息指纹映射到一些自然数上,最后在建立的那个很长的二进制上把这些自然数的位置都置为1。布隆过滤器的不足之处是它可能把不在集合中的元素错判成集合中的元素,但在某些条件下这个概率是很小的,补救措施是可以建立一个小的白名单,存储那些可能误判的元素。布隆过滤器背后的数学原理在于完全随机的数字其冲突的可能性很小,可以用很少的空间存储大量的信息,并且由于只进行简单的算术运算,因此速度非常快。《编程珠玑》中第一章的那个例子就是布隆过滤器的思想。开阔思维,寻找更好更简单的方法。
第***章《马尔科夫链的扩展——贝叶斯网络》:贝叶斯网络是马尔科夫链的扩展,由简单的线性链式关系扩展为网络的关系,但贝叶斯网络仍然假设每一个状态只与它直接相连的状态相关。确定贝叶斯网络的拓扑结构和各个状态之间相关的概率也需要训练。在词分类中,可以建立文章、主题和关键词的贝叶斯网络,用来得到词的分类。贝叶斯网络的训练包括确定拓扑结构和转移概率,比较复杂,后者可以参考最大熵训练的方法。贝叶斯网络导出的模型是非常复杂的。
第二十五章《条件随机场和句法分析》:句法分析是分析出一个句子的句子结构,对于不规则的句子,对其进行深入的分析是很复杂的,而浅层的句法分析在很多时候已经可以满足要求了。条件随机场就是进行浅层句法分析的有效的数学模型。条件随机场与贝叶斯网络很像,不用之处在于,条件随机场是无向图,而贝叶斯网络是有向图。条件随机场的训练很复杂,简化之后可以参考最大熵训练的方法。对于条件随机场的详细参数及原理还不理解。
第二十六章《维特比和他的维特比算法》:维特比算法是一个动态规划算法,凡是使用隐马尔科夫模型描述的问题都可以用它来解码。维特比算法采用逐步渐进的方法,计算到每步的最短距离,到下步的最短距离只用接着本步的计算即可,相比穷举法,**缩短了计算的时间,并且基本可以实现实时的输出,这看似简单,但在当时确是很了不起的.。维特比并不满足停留在算法本身,他将算法推广出去,并应用到了实际中,创立了高通公司,成为了世界上第二富有的数学家。高通公司在第二代移动通信中并不占很强的市场地位,而其利用CDMA技术霸占了3G的市场,可见远见的洞察力是多么的重要。
第二十七章《再谈文本分类问题——期望最大化算法》:该章讲的其实就是K均值聚类问题,设置原始聚类中心,然后不断迭代,直至收敛,将每个点分到一个类中。其实隐马尔科夫模型的训练和最大熵的训练都是期望最大化算法(EM)。首先,根据现有的模型,计算各个观测数据输入到模型中的计算结果,这个过程称为期望值计算过程,或E过程;接下来,重新计算模型参数,以最大化期望值,这个过程称为最大化的过程,或M过程。优化的目标函数如果是个凸函数,则一定有全局最优解,若不是凸函数,则可能找到的是局部最优解。在以后的一些问题求解过程中,应该考虑其是否是EM问题,也可以考虑参考这种思想,不断迭代以优化目标的过程。
第二十八章《逻辑回归和搜索广告》:雅虎和百度的竞价排名广告并不比谷歌的根据广告的预估点击率来客观的推送广告收入多。点击预估率有很多影响因素,一种有效的方法是逻辑回归模型,逻辑回归模型是一种将影响概率的不同因素结合在一起的指数模型。其训练方法和最大熵模型相似。同样不是很理解其具体内涵。
第二十九章《各个击破和Google云计算的基础》:分而治之,各个击破是一个很好的方法,Google开发的MapReduce算法就应用了该方法。将一个大任务分成几个小任务,这个过程叫Map,将小任务的结果合并成最终结果,这个过程叫Reduce,该过程如何调度、协调就是工程上比较复杂的事情了。可见大量用到的、真正有用的方法往往简单而又朴实。
附录《计算复杂度》:计算机中复杂度是以O()来表示的,如果一个算法的计算量不超过N的多项式函数,则称算法为多项式函数复杂度的(P问题),是可以计算的。若比N的多项式函数还高,则是非多项式问题,实际上是不可计算的。非多项式问题中一种非确定的多项式问题(简称NP),是科学家研究的焦点,因为现实中好多问题都是NP问题。另外还有NP-Complete问题(NP问题可以在多项式时间内规约到该问题)和NP-Hard问题,对于这两种问题,需要简化找到近似解。
整体上,《数学之美》这本书让我了解了很多文本处理,数据挖掘相关的知识,学到了很多。其中,简单美以及一些科学家的大师风范让我印象深刻!书中提到的一些思想(即道)让我受益匪浅!
《数学之美》读书笔记9
最近看了这本《数学之美》,不得不感叹一句,可惜早已身不在起点。
我读书的时候,数学成绩一直都很好,虽然离开学校已经10多年,自觉当初的知识还是记得很多,6~7年前再考线性代数和概率论,还是得到了很高的分数。不过我也和大部分人一样,觉得数学没有太多用处,特别是高中和大学里面学的,那些三角函数,向量,大数定律,解析几何,除了在考试的题目里面用一下,*时又有什么地方可以用呢?
看了《数学之美》,惊叹于数学的浩瀚和简单,说它浩瀚,是因为它的分支涵盖了科学的方方面面,是所有科学的理论基础,说它简单,无论多复杂的问题,最后总结的数学公式都简单到只有区区几个符号和字母。
这本书介绍数学理论在互联网上的运用,*时我们在使用互联网搜索或者翻译功能的时候,时常会感叹电脑对自己的了解和它的聪明,其实背后的原理就是一个个精美的算法和大量数据的训练。那些或者熟悉或者陌生的数学知识(联合概率分布,维特比算法,期望最大化,贝叶斯网络,隐形马尔可夫链,余弦定律,etc),一步步构建了我们现在所赖以生存的网上世界。
之所以觉得自己早已身不在起点,是因为上面这些数学知识,早已经不在我的知识框架之内,就算曾经学过,也不过是囫囵吞枣一样的强记硬背,没有领会过其中的真正意义。而今天想重头在来学一次,其实已经不可能了。且不说要花费多少的精力和时间,还需要的是领悟力。而这一些,已经不是我可以简单付出的。
不像物理、化学需要复杂的实验来验证,很多数学的证明,几乎只要有一颗聪明的头脑和无数的草稿纸,可是光是这颗聪明的头脑,就可以阻拦掉很多人。有人说多读书就会聪明,我不否认,书本的确会提供很多知识,可是不同的人读同一本书也会有不同的收货,这就限制于每个人的知识框架和认知水*。就如一个数学功底好过我的人,看这本书,就会更容易理解里面的公式和推导出这些公式的其他运用点,而我,只能站在数学的门口,感叹一句,它真的好美吧。
当然,我暂时无法在实际生活中运用这些数学公式,可是书中提到的一些方法论,还是很有帮助的
1)一个产业的颠覆或者创新,大部分来自于外部的力量,比如用统计学原理做自然语言处理。
2)基础知识和基础数据是很重要性,只有足够多和足够广的数据,才可以提供有效的分析,和验证分析方法的好坏。
3)先帮用户解决80%的问题,在慢慢解决剩下的20%的问题;
4)不要等一个东西完美了,才发布;
5)简单是美,坚持选择简单的做法,这样会容易解释每一个步骤和方法背后的道理,也便于查错。
6)正确的模型也可能受噪音干扰,而显得不准确;这时不应该用一种凑合的修正方法加以弥补,而是要找到噪音的根源,从根本上修正它。
7)一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物。
《数学之美》读书笔记10
很多人都觉得,数学是一个太高深、太理论的学科,不接近生活,对我们大多数人来说*时也根本用不到,所以没必要去理解数学。但事情真的是这样吗?
其实不然,数学一直渗透在我们生活的各个方面,尤其是在今天这个信息时代,很多简单朴素的数学思想,能发挥一般人很难想象的巨大作用。比如,计算机处理自然语言,用到的最重要工具是统计学的思想;计算机对**内容的分类,依靠的是数学里的余弦定理;而电子电路的基本逻辑,则来源于仅有0和1两个数字的布尔代数。
在《数学之美》里,吴军用自己在工作中使用数学的亲身经历,为我们展现了数学的重要性,以及他对数学之美的理解。吴军是“得到”App专栏《吴军的谷歌方法论》的主理人。曾先后供职于谷歌和腾讯,是著名的自然语言处理专家和搜索专家。同时,他还是位畅销书作家,除了这本《数学之美》以外,还写过《文明之光》《智能时代》《浪潮之巅》等多本畅销书。
朱光潜《谈美书简》读书笔记10篇(扩展6)
——最新的谈生命读书笔记
最新的谈生命读书笔记1
冰心用清新、明丽的笔调写了谈生命一问,此文用形象的比喻阐述了人的生命历程,除了给读者语言美的享受之外,哲理性的语言还给读者生命上的`启迪。
其中最让我百读不厌的句子是:“不是每一道江流都能入海,不流动的便成了死湖;不是每一粒种子都能成树,不生长的便成了空壳!生命中不是永远快乐,也不是永远痛苦,快乐和痛苦是相生相成的。等于水道要经过不同的*,树木要经过常变的四时。在快乐中我们在感谢生命,在痛苦中我们要感谢生命。快乐固然兴奋,痛苦又何尝不美丽?我曾读到一个警句,是”愿你生命中有够多的云翳,来造成一个美丽的黄昏“。
世界、国家和个人的生命中的云翳没有比今天再多的了。”我常常在读之后,内心对生命的认识仿佛又打开了一扇门,是啊!生命的历程是曲折的,它伴随着快乐和痛苦,虽然我们都不愿意生命中有痛苦,但少了他,我们的生命色调太单一,我们的人生就失去了完美,因此重要的是我们如何去面对快乐和痛苦。
我们会享受生命中的快乐,也要学会面对生命中的痛苦,痛苦中的伤心、流泪都是没用的,因此,一次痛苦的经历我们要从中感悟生命,学会在逆境中生存,向着目的执着的拼搏!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 yyfangchan@163.com (举报时请带上具体的网址) 举报,一经查实,本站将立刻删除