Archive for the ‘读书笔记’ category

OS的分页分段(笔记)

September 2nd, 2014

我们从80386处理器入手。首先,到了80386时代,CPU有了四种运行模式,即实模式、保护模式、虚拟8086模式和SMM模式。

实模式其大致包括实模式1MB的线性地址空间、内存寻址方法、寄存器、端口读写以及中断处理方法等内容。到了80386时代,引进了一种沿用至今的CPU运行机制——保护模式(Protected Mode)。保护模式有一些新的特色,用来增强系统稳定度,比如内存保护,分页系统,以及硬件支持的虚拟内存等。

对CPU来讲,系统中的所有储存器中的储存单元都处于一个统一的逻辑储存器中,它的容量受CPU寻址能力的限制。

这个逻辑储存器就是我们所说的线性地址空间。8086有20位地址线,拥有1MB的线性地址空间。而80386有32位地址线,拥有4GB的线性地
址空间。但是80386依旧保留了8086采用的地址分段的方式,只是增加了一个折中的方案,即只分一个段,段基址0×00000000,段长0xFFFFFFFF(4GB),这样的话整个线性空间可以看作就一个段,这就是所谓的平坦模型(Flat Mode)» Read more: OS的分页分段(笔记)

数据挖掘—–自己整理的笔记

July 11th, 2014

将近一个月没有更新博客,主要这期间有太多的考试,数据挖掘就是其中的一门比较难的课程,由于一直不敢怎么掉以轻心,总结了好长的笔记来复习。其实在读研期间也曾考虑学习Data Mining方向,虽说不是很擅长,但是通过这门课也算是data mining入了门。

本科时候也学过这门课,那时候主要以计算为主,其中的原理有很多是云里雾里的感觉。这次的学习,使得我从数据的预处理,到关联规则,分类,聚类的算法,有了清晰的了解,并可以通过分析各个算法的优缺点,改进现有某个算法的存在的问题。

比如:

支持向量机( SVM)是 一种具有高准确率的分类方法。但是SVM 处理大型数据元组集时,速度很慢试开发一种可伸缩的算法克服以上困难。
1,先使用层次聚类的CF-tree构造出微小的聚类簇
2. 找出聚类簇的质心代表该聚类,然后使用SVM进行训练,这样可以大大减少数据元组的数量。
3. 找出超平面来划分这些微型聚类簇。
4. 加入新的聚类簇来进行SVM训练
5. 直到没有新的聚类簇加入,分类完毕

又比如:

提升的基本思想:假设你是一位患者,有某某些症状.你选择咨询多位医生,假设你根据医生先前的诊断准确率,对每位医生的诊断赋予一个权重.然后这些加权诊断的组合最为最终的诊断,这就是提升的基本思想.

提高决策归纳准确性的原因:在提升方法中,权重赋予每个训练元组.迭代的学习K个分类器序列,学习得到分类器Mi之后,更新权重,使得其后的分类器Mi+1”更关注” Mi误分类的训练元组,最终提升的分类器M*组合每个个体分类器,其中每个分类器投票的权重是其准确率的函数。可以扩充提升算法,预测连续值。

这个就是分类与聚类的结合,通过这种方式,我们克服了SVM的缺点,为我们所用!

下面贴出我从数据预处理,OLAP,到数据各种分类算法的笔记:

» Read more: 数据挖掘—–自己整理的笔记

异常控制流(读书笔记)

March 13th, 2014

今天阅读了一下计算机对于异常处理的章节,我把一些有用的摘出来,方便以后回顾。
异常控制除了中断,还包括system call,我会一直向这篇文章中添加自己读书内容的。
» Read more: 异常控制流(读书笔记)

中断下半部分(读书笔记)

January 15th, 2014

中断处理分为两个部分:上半部和下半部。中断处理程序属于上半部.
下半部的任务就是执行与中断处理程序密切相关但中断处理程序本身不执行,推后执行的工作。 » Read more: 中断下半部分(读书笔记)

编写Linux中断处理程序(上半部)(读书笔记)

January 7th, 2014

今天看了Linux中断处理的前半部分。中断,本质上是一种特殊的电信号。

» Read more: 编写Linux中断处理程序(上半部)(读书笔记)