简单粗暴的百度图片爬虫

最近在忙着赶紧把去年作死申的国创结题了。。然而我比较宅,都懒得跑出去采集数据集(就是拍照😂)于是想找个爬虫直接把百度图片给扒下来,然而我在网上搜到的代码都比较旧了,不太适用于现在的百度图片(话说最近dl不是很火么按理来说度娘图片的爬虫应该很多啊23333),于是我今早就码了一个简单粗暴的爬虫出来。。。

flex+bison+llvm简易学习心得

没错这其实是实验报告。。。不过看起来确实比较像blog文章。。

1. 总体过程

  • 文法分析用Flex:将数据分隔成一个个的标记token (标示符identifiers,关键字keywords,数字numbers, 中括号brackets, 大括号braces, 等等etc.)

  • 语法分析用Bison: 在分析标记的时候生成抽象语法树. Bison 将会做掉几乎所有的这些工作, 只用定义好抽象语法树。

  • 组装用LLVM: 遍历抽象语法树,并为每一个节点生成字节/机器码。

构造一个编译器大概是如下的流程:

利用Wireshark观察网络报文

上计算机网络课的时候的实验报告,图很多很多。。。

1.实验内容

  1. 捕获观察并分析以太帧结构。
  2. 观察并分析ARP协议的报文
  3. 捕捉UDP报文并验证其校验和
  4. 捕捉TCP报文的连接释放–四次握手(注意 TCP Segment Len、Windows size value、Checksum等)
  5. 捕捉除TCP、UDP之外的4种IP层以上的网络协议(例如HTTP、ICMP、SSDP、QICQ等),并尝试分析

聚类效果评价指标

这周web课布置了个调研作业,记录一下。。。 1. Davies Bouldin Index 常用于聚类效果评价的指标为:Davies Bouldin Index,它的表达式可以写为: $$DB=\frac{1}{N}\sum_{i\neq j}\frac{\rho_i-\rho_j}{d(c_i-c_j)}$$ 其中\(\