- 第1讲:网络搜索原理概览
- 第1讲答疑
- 第2讲:极简搜索的实现
- 第2讲答疑
- 第3讲:排序初体验与正文的爬取
- 第3讲答疑
- 第4讲:排序、高亮的进化和搜索类的封装
- 第4讲答疑
- 第5讲:缓存机制的设计与优化
- 第5讲答疑
- 第6讲:瓶颈分析与倒排索引的出现
- 第6讲答疑
- 第7讲:短语和长句的搜索
- 第7讲答疑
- 第8讲 多关键词的正文摘要和高亮
- 第8讲答疑 1\u002F2
- 第8讲答疑 2\u002F2
- 第9讲 摘要及高亮的进一步改进
- 第10讲 搜索结果排序方式的改进
- 第10讲答疑
- 第11讲 TFIDF\u002FBM25打分算法与布尔查询初步实现
- 第11讲答疑
- 第12讲 复杂布尔查询的处理
- 第12讲答疑
- 第13讲 拼写校正建议的实现
- 第13讲答疑
- 第14讲 搜索排序之向量空间模型
- 第14讲答疑
1. 前言
P1的课程名称是《网络搜索的概念、意义与通用架构》。前言记录的是与整个课程主线没有直接关联,但却有价值的一些知识点。
首先最让我钦佩的是老师并没有PPT,而是全程搜索来讲解。而且每个人要进行现场编程。
课堂授课的两个重要意义:
扩展认知边界。
一起学习成长,参与并塑造课程,如建设性的反馈和有深度的问题。
老师在备课做PPT的时候,首先做的是图片搜索,而不是搜索文章(PPT的灵魂在于能否快速的打动人心,在短时间内图片的感染力是远远超过文字)。
课中老师播放了逻辑思维的《突破元无知》。反应的是在搜索过程中,虽然目标很明确,但是却无法直接进行描述,或者通过线头去按图索骥。
按照知道这个维度对世界进行分类。世界可以分为知道自己知道、知道自己不知道(自知之明)、不知道自己不知道(高估自己)、不知道自己知道。这也是用户使用搜索的四种状态。
理解新概念最好的方法之一是通过维基百科(网络搜索引擎)。先看目录,再看具体内容。
老师使用了wikiwand和super simple highlighter(高亮标记)的两个Chrome插件。
2. 什么是搜索
对于中文的概念,可以使用汉典(https://www.zdic.net/)进行查询。