<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
    <title>Thinkjam.org - 原生脑浆</title>
    <link rel="alternate" type="text/html" href="http://thinkjam.org/" />
    <link rel="self" type="application/atom+xml" href="http://thinkjam.org/atom.xml" />
    <id>tag:thinkjam.org,2010-09-08://8</id>
    <updated>2013-02-10T07:33:38Z</updated>
    <subtitle>－－思想与您共分享</subtitle>
    <generator uri="http://www.sixapart.com/movabletype/">Movable Type 5.12</generator>

<entry>
    <title>永遇乐·京口北固亭怀古 - The Great Great Great MULLAR</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mullar/2013/02/post-28.html" />
    <id>tag:www.thinkjam.org,2013:/mullar//6.1318</id>

    <published>2013-02-10T07:32:22Z</published>
    <updated>2013-02-10T07:33:38Z</updated>

    <summary><![CDATA[ &nbsp; 【宋&middot;辛弃疾】 &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 千古江山，英雄无觅孙仲谋处。舞榭(xi&egrave;)歌台，风流总被,雨打风吹去。斜阳草树，寻常巷陌，人道寄奴曾住。想当年，金戈铁马，气吞万里如虎。 &nbsp; &nbsp; &nbsp; &nbsp; 元嘉草草，封狼居胥（xū），赢得仓皇北顾。四十三年，望中犹记，烽火扬州路。可堪回首，佛(b&igrave;)狸（l&iacute;）祠（c&iacute;）下，一片神鸦社鼓。凭谁问：廉颇老矣，尚能饭否?...]]></summary>
    <author>
        <name>mullar</name>
        
    </author>
    
        <category term="广为众生说" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="zh-cn" xml:base="http://www.thinkjam.org/mullar/">
        <![CDATA[<p>
	&nbsp;</p>
<div>
	【宋&middot;辛弃疾】</div>
<div>
	&nbsp;</div>
<div>
	<div>
		&nbsp; &nbsp; &nbsp; &nbsp; 千古江山，英雄无觅孙仲谋处。舞榭(xi&egrave;)歌台，风流总被,雨打风吹去。斜阳草树，寻常巷陌，人道寄奴曾住。想当年，金戈铁马，气吞万里如虎。</div>
	<div>
		&nbsp; &nbsp; &nbsp; &nbsp; 元嘉草草，封狼居胥（xū），赢得仓皇北顾。四十三年，望中犹记，烽火扬州路。可堪回首，佛(b&igrave;)狸（l&iacute;）祠（c&iacute;）下，一片神鸦社鼓。凭谁问：廉颇老矣，尚能饭否?</div>
</div>
]]>
        
    </content>
</entry>

<entry>
    <title>座右铭改：活着 - The Great Great Great MULLAR</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mullar/2013/02/post-27.html" />
    <id>tag:www.thinkjam.org,2013:/mullar//6.1317</id>

    <published>2013-02-10T07:24:23Z</published>
    <updated>2013-02-10T07:24:57Z</updated>

    <summary> 活着！！！！！！！！...</summary>
    <author>
        <name>mullar</name>
        
    </author>
    
        <category term="人间道" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="zh-cn" xml:base="http://www.thinkjam.org/mullar/">
        <![CDATA[<p>
	活着！！！！！！！！</p>
]]>
        
    </content>
</entry>

<entry>
    <title>廉颇老矣 - The Great Great Great MULLAR</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mullar/2013/02/post-26.html" />
    <id>tag:www.thinkjam.org,2013:/mullar//6.1316</id>

    <published>2013-02-03T15:31:17Z</published>
    <updated>2013-02-03T15:33:24Z</updated>

    <summary> 岁月不留人啊，一转眼36了，还单着。逝去的找不回来了，现在那个阶段的女人太物质，心智太老成了。 唉，难哦。心无挂碍，无挂碍故，无忧恐怖，远离颠倒梦想，究竟涅磐。...</summary>
    <author>
        <name>mullar</name>
        
    </author>
    
        <category term="人间道" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="zh-cn" xml:base="http://www.thinkjam.org/mullar/">
        <![CDATA[<p>
	岁月不留人啊，一转眼36了，还单着。逝去的找不回来了，现在那个阶段的女人太物质，心智太老成了。</p>
<p>
	唉，难哦。心无挂碍，无挂碍故，无忧恐怖，远离颠倒梦想，究竟涅磐。</p>
]]>
        
    </content>
</entry>

<entry>
    <title>妈妈要上班去吧 - Just 平生一笑</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/zoptuno/archives/2013/01/baby-love.html" />
    <id>tag:www.thinkjam.org,2013:/zoptuno//2.1315</id>

    <published>2013-01-20T15:24:47Z</published>
    <updated>2013-01-20T15:48:59Z</updated>

    <summary><![CDATA[ 2岁半小朋友的脑袋瓜子真让人吃惊，浅浅早上看起来是想多睡一会儿，所以在妈妈凑到脸旁要其起床时，竟然脱口而出：&ldquo;妈妈，你要上班去吧，好吗？&rdquo;那口气，简直让人忍俊不禁。 &nbsp; 浅浅碰到事情时，越来越多的采用迂回路线达到目的，让人感叹小孩子在很多时候比大人都有方法。浅浅身上，到处是对环境生气勃勃的反馈，陷入思维定势的大人们很难保有这份童真。 &nbsp; 浅浅让我们不时看到了这份童真的片段，让人没有任何掺杂纯粹的开心，这可能是为人父母者最大的回报。...]]></summary>
    <author>
        <name>平生一笑</name>
        <uri>http://www.thinkjam.org/zoptuno/</uri>
    </author>
    
        <category term="生活" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="zh-cn" xml:base="http://www.thinkjam.org/zoptuno/">
        <![CDATA[<p>
	2岁半小朋友的脑袋瓜子真让人吃惊，浅浅早上看起来是想多睡一会儿，所以在妈妈凑到脸旁要其起床时，竟然脱口而出：&ldquo;妈妈，你要上班去吧，好吗？&rdquo;那口气，简直让人忍俊不禁。</p>
<p>
	&nbsp;</p>
<p>
	浅浅碰到事情时，越来越多的采用迂回路线达到目的，让人感叹小孩子在很多时候比大人都有方法。浅浅身上，到处是对环境生气勃勃的反馈，陷入思维定势的大人们很难保有这份童真。</p>
<p>
	&nbsp;</p>
<p>
	浅浅让我们不时看到了这份童真的片段，让人没有任何掺杂纯粹的开心，这可能是为人父母者最大的回报。</p>
]]>
        
    </content>
</entry>

<entry>
    <title>Java虚拟机：32位编译与64位运行问题 - 绝望的流星</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/meteor/2012/11/java3264.html" />
    <id>tag:www.thinkjam.org,2012:/meteor//4.1314</id>

    <published>2012-11-20T11:55:40Z</published>
    <updated>2012-11-20T12:06:27Z</updated>

    <summary> 需求：快速的对数亿条数据进行粗略统计 技术实现：采用Java的LinkedHashMap与HashMap在内存中进行运算 由于开发机的内存不够大，需要将开发机器上的程序打包传到服务器上运行，但是在运行的过程中，每次运行至1.5亿后，程序运算时间明显变慢，成2的n次方级别递增。 这时候查看内存，Java程序进程占用内存为4G，很熟悉的数字。 经检查发现，程序开发机的JDK是32位的，而服务器端的JDK是64位的，换了台64位的机器，使用64位JDK打包上传，问题解决。 开发环境和运行环境的一致性一如既往的重要啊。...</summary>
    <author>
        <name>meteor</name>
        
    </author>
    
        <category term="程序" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="32位" label="32位" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="64位" label="64位" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="java" label="Java" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="一致" label="一致" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="虚拟机" label="虚拟机" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/meteor/">
        <![CDATA[<p>
	<strong>需求：</strong>快速的对数亿条数据进行粗略统计</p>
<p>
	<strong>技术实现：</strong>采用Java的LinkedHashMap与HashMap在内存中进行运算</p>
<p>
	由于开发机的内存不够大，需要将开发机器上的程序打包传到服务器上运行，但是在运行的过程中，每次运行至1.5亿后，程序运算时间明显变慢，成2的n次方级别递增。</p>
<p>
	这时候查看内存，Java程序进程占用内存为4G，很熟悉的数字。</p>
<p>
	经检查发现，程序开发机的JDK是32位的，而服务器端的JDK是64位的，换了台64位的机器，使用64位JDK打包上传，问题解决。</p>
<p>
	开发环境和运行环境的一致性一如既往的重要啊。</p>
]]>
        
    </content>
</entry>

<entry>
    <title>Java次方运算性能测试 - 绝望的流星</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/meteor/2012/11/java.html" />
    <id>tag:www.thinkjam.org,2012:/meteor//4.1313</id>

    <published>2012-11-20T02:08:46Z</published>
    <updated>2012-11-20T02:54:43Z</updated>

    <summary><![CDATA[ 背景：最近工作中使用聚类算法进行数据分类，采用欧氏距离计算特征矢量的相似度，由于数据维度太大，运算比较耗时，除去使用各种办法减小运算次数外，需要对每一行代码进行优化。 由于每次迭代需要上百亿次的平方运算，原来的代码采用的Math.pow的方法进行平方运算，如果这一个步骤每次都可以节省一些时间，那么对于上百亿次的运算来讲，运算时间将大大缩减。 &nbsp; 采用了三种运算方式，进行对比，结果如下（实验数据使用浮点数）： 平方运算（耗时单位：ms）： 运算次数/耗时 1亿次 2亿次 4亿次 8亿次 16亿次 Math.pow 1245 2499 5003 9972 19932 StrictMath.pow 1905 3893 7789 15531 31437 x*x 35 69 140 286 549 &nbsp; &nbsp; 三次方运算（耗时单位：ms）： &nbsp; 运算次数/耗时 1亿次 2亿次 4亿次 8亿次 16亿次...]]></summary>
    <author>
        <name>meteor</name>
        
    </author>
    
        <category term="小实验" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="java" label="Java" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="math" label="Math" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="pow" label="pow" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="平方" label="平方" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="性能" label="性能" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="次方" label="次方" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/meteor/">
        <![CDATA[<p>
	<strong>背景：</strong>最近工作中使用聚类算法进行数据分类，采用欧氏距离计算特征矢量的相似度，由于数据维度太大，运算比较耗时，除去使用各种办法减小运算次数外，需要对每一行代码进行优化。</p>
<p>
	由于每次迭代需要上百亿次的平方运算，原来的代码采用的Math.pow的方法进行平方运算，如果这一个步骤每次都可以节省一些时间，那么对于上百亿次的运算来讲，运算时间将大大缩减。</p>
<p>
	&nbsp;</p>
<p>
	采用了三种运算方式，进行对比，结果如下（实验数据使用浮点数）：</p>
<p>
	平方运算（耗时单位：ms）：</p>
<table border="1" cellpadding="1" cellspacing="1" style="width: 500px; height: 80px;">
	<tbody>
		<tr>
			<td>
				运算次数/耗时</td>
			<td>
				1亿次</td>
			<td>
				2亿次</td>
			<td>
				4亿次</td>
			<td>
				8亿次</td>
			<td>
				16亿次</td>
		</tr>
		<tr>
			<td>
				Math.pow</td>
			<td>
				1245</td>
			<td>
				2499</td>
			<td>
				5003</td>
			<td>
				9972</td>
			<td>
				19932</td>
		</tr>
		<tr>
			<td>
				StrictMath.pow</td>
			<td>
				1905</td>
			<td>
				3893</td>
			<td>
				7789</td>
			<td>
				15531</td>
			<td>
				31437</td>
		</tr>
		<tr>
			<td>
				x*x</td>
			<td>
				35</td>
			<td>
				69</td>
			<td>
				140</td>
			<td>
				286</td>
			<td>
				549</td>
		</tr>
	</tbody>
</table>
<p>
	&nbsp;</p>
<div>
	&nbsp;</div>
<div>
	三次方运算（耗时单位：ms）：</div>
<div>
	&nbsp;</div>
<div>
	<table border="1" cellpadding="1" cellspacing="1" style="width: 500px; height: 80px;">
		<tbody>
			<tr>
				<td>
					运算次数/耗时</td>
				<td>
					1亿次</td>
				<td>
					2亿次</td>
				<td>
					4亿次</td>
				<td>
					8亿次</td>
				<td>
					16亿次</td>
			</tr>
			<tr>
				<td>
					Math.pow</td>
				<td>
					19177</td>
				<td>
					38576</td>
				<td>
					77039</td>
				<td>
					154462</td>
				<td>
					312001</td>
			</tr>
			<tr>
				<td>
					StrictMath.pow</td>
				<td>
					20296</td>
				<td>
					40507</td>
				<td>
					80848</td>
				<td>
					162794</td>
				<td>
					332476</td>
			</tr>
			<tr>
				<td>
					x*x*x</td>
				<td>
					36</td>
				<td>
					70</td>
				<td>
					140</td>
				<td>
					301</td>
				<td>
					587</td>
			</tr>
		</tbody>
	</table>
	<p>
		通过实验结果可以看出，pow的性能在大运算量的情况下不是特别理想。</p>
</div>
<p>
	&nbsp;</p>
]]>
        
    </content>
</entry>

<entry>
    <title>数据可视化工具：d3js - 绝望的流星</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/meteor/2012/11/post.html" />
    <id>tag:www.thinkjam.org,2012:/meteor//4.1312</id>

    <published>2012-11-19T10:16:59Z</published>
    <updated>2012-11-20T02:51:16Z</updated>

    <summary><![CDATA[ 可视化的数据可以让数据分析的结果更加直观，便于发觉隐含内容；最近需要对聚类算法的结果数据进行进一步的分析，探索了一些可视化的工具或组件，最后选择了d3js。 &nbsp; Data-Driven Documents(d3)是一个JavaScript类库，基于W3C标准，使用HTML、SVG和CSS把数据转换为各种绚丽的图形。 &nbsp; 支持的数据格式有常见的：txt、html、json、html、xml、csv等 &nbsp; 直接调用d3库制作的Bubble图（如下）： &nbsp; 2万条数据耗时10秒左右（肉眼估测）； &nbsp; 更多内容请见： 官方主页：http://d3js.org/ &nbsp; 在线示例：https://github.com/mbostock/d3/wiki/Gallery...]]></summary>
    <author>
        <name>meteor</name>
        
    </author>
    
        <category term="数据分析" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="d3" label="d3" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="数据分析" label="数据分析" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="数据可视化" label="数据可视化" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/meteor/">
        <![CDATA[<p>
	可视化的数据可以让数据分析的结果更加直观，便于发觉隐含内容；最近需要对聚类算法的结果数据进行进一步的分析，探索了一些可视化的工具或组件，最后选择了d3js。</p>
<p>
	&nbsp;</p>
<p>
	Data-Driven Documents(d3)是一个JavaScript类库，基于W3C标准，使用HTML、SVG和CSS把数据转换为各种绚丽的图形。</p>
<p>
	&nbsp;</p>
<p>
	支持的数据格式有常见的：txt、html、json、html、xml、csv等</p>
<p>
	&nbsp;</p>
<p>
	直接调用d3库制作的Bubble图（如下）：</p>
<p>
	<a href="http://www.thinkjam.org/meteor/assets_c/2012/11/cluster_20121119182946-22.html" onclick="window.open('http://www.thinkjam.org/meteor/assets_c/2012/11/cluster_20121119182946-22.html','popup','width=811,height=679,scrollbars=no,resizable=no,toolbar=no,directories=no,location=no,menubar=no,status=no,left=0,top=0'); return false"><img alt="cluster_20121119182946.png" class="mt-image-none" height="376" src="http://www.thinkjam.org/meteor/assets_c/2012/11/cluster_20121119182946-thumb-450x376-22.png" width="450" /></a></p>
<p>
	&nbsp;</p>
<p>
	2万条数据耗时10秒左右（肉眼估测）；</p>
<p>
	&nbsp;</p>
<p>
	更多内容请见：</p>
<p>
	官方主页：http://d3js.org/</p>
<p>
	&nbsp;</p>
<p>
	在线示例：https://github.com/mbostock/d3/wiki/Gallery</p>
]]>
        
    </content>
</entry>

<entry>
    <title>【转】布隆过滤器 (Bloom Filter) 详解 - 绝望的流星</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/meteor/2012/11/-bloom-filter.html" />
    <id>tag:www.thinkjam.org,2012:/meteor//4.1311</id>

    <published>2012-11-19T01:22:06Z</published>
    <updated>2012-11-20T02:53:24Z</updated>

    <summary><![CDATA[ &nbsp; 作者：Allen Sun &nbsp; 布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出，它是一种space efficient的概率型数据结构，用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也能用于判断元素是否在集合中，但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入元素，但不可以删除已有元素。其中的元素越多，false positive rate(误报率)越大，但是false negative (漏报)是不可能的。 &nbsp; 本文将详解布隆过滤器的相关算法和参数设计，在此之前希望大家可以先通过谷歌黑板报的数学之美系列二十一 － 布隆过滤器（Bloom Filter）来得到些基础知识。 &nbsp; &nbsp; 一. 算法描述 一个empty bloom filter是一个有m bits的bit array，每一个bit位都初始化为0。并且定义有k个不同的hash function，每个都以uniform random distribution将元素hash到m个不同位置中的一个。在下面的介绍中n为元素数，m为布隆过滤器或哈希表的slot数，k为布隆过滤器重hash function数。 &nbsp; 为了add一个元素，用k个hash function将它hash得到bloom filter中k个bit位，将这k个bit位置1。 &nbsp; 为了query一个元素，即判断它是否在集合中，用k个hash function将它hash得到k个bit位。若这k...]]></summary>
    <author>
        <name>meteor</name>
        
    </author>
    
        <category term="算法" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="bloomfilter" label="Bloom Filter" scheme="http://www.sixapart.com/ns/types#tag" />
    <category term="布隆过滤器" label="布隆过滤器" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/meteor/">
        <![CDATA[<p>
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	<b style="margin: 0px; padding: 0px; font-family: 微软雅黑;">作者：<a href="http://www.cnblogs.com/allensun/" style="margin: 0px; padding: 0px; color: black;" target="_blank">Allen Sun</a></b></p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出，它是一种space efficient的概率型数据结构，用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也能用于判断元素是否在集合中，但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入元素，但不可以删除已有元素。其中的元素越多，false positive rate(误报率)越大，但是false negative (漏报)是不可能的。</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	本文将详解布隆过滤器的相关算法和参数设计，在此之前希望大家可以先通过谷歌黑板报的<a href="http://www.google.com.hk/ggblog/googlechinablog/2007/07/bloom-filter_7469.html" style="margin: 0px; padding: 0px; color: black;">数学之美系列二十一 － 布隆过滤器（Bloom Filter）</a>来得到些基础知识。</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px; color: rgb(0, 0, 0); font-family: verdana, 'ms song', 宋体, Arial, 微软雅黑, Helvetica, sans-serif; font-size: 14px; line-height: 22px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<font size="4" style="margin: 0px; padding: 0px;"><strong style="margin: 0px; padding: 0px;">一. 算法描述</strong></font></p>
<p style="margin: 10px auto; padding: 0px;">
	一个empty bloom filter是一个有m bits的bit array，每一个bit位都初始化为0。并且定义有k个不同的hash function，每个都以uniform random distribution将元素hash到m个不同位置中的一个。在下面的介绍中n为元素数，m为布隆过滤器或哈希表的slot数，k为布隆过滤器重hash function数。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	为了add一个元素，用k个hash function将它hash得到bloom filter中k个bit位，将这k个bit位置1。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	为了query一个元素，即判断它是否在集合中，用k个hash function将它hash得到k个bit位。若这k bits全为1，则此元素在集合中；若其中任一位不为1，则此元素比不在集合中（因为如果在，则在add时已经把对应的k个bits位置为1）。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	不允许remove元素，因为那样的话会把相应的k个bits位置为0，而其中很有可能有其他元素对应的位。因此remove会引入false negative，这是绝对不被允许的。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	当k很大时，设计k个独立的hash function是不现实并且困难的。对于一个输出范围很大的hash function（例如MD5产生的128 bits数），如果不同bit位的相关性很小，则可把此输出分割为k份。或者可将k个不同的初始值（例如0,1,2, &hellip; ,k-1）结合元素，feed给一个hash function从而产生k个不同的数。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	当add的元素过多时，即n/m过大时（n是元素数，m是bloom filter的bits数），会导致false positive过高，此时就需要重新组建filter，但这种情况相对少见。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<font size="4" style="margin: 0px; padding: 0px;"><strong style="margin: 0px; padding: 0px;">二. 时间和空间上的优势</strong></font></p>
<p style="margin: 10px auto; padding: 0px;">
	当可以承受一些误报时，布隆过滤器比其它表示集合的数据结构有着很大的空间优势。例如self-balance BST, tries, hash table或者array, chain，它们中大多数至少都要存储元素本身，对于小整数需要少量的bits，对于字符串则需要任意多的bits（tries是个例外，因为对于有相同prefixes的元素可以共享存储空间）；而chain结构还需要为存储指针付出额外的代价。对于一个有1%误报率和一个最优k值的布隆过滤器来说，无论元素的类型及大小，每个元素只需要9.6 bits来存储。这个优点一部分继承自array的紧凑性，一部分来源于它的概率性。如果你认为1%的误报率太高，那么对每个元素每增加4.8 bits，我们就可将误报率降低为原来的1/10。add和query的时间复杂度都为O(k)，与集合中元素的多少无关，这是其他数据结构都不能完成的。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	如果可能元素范围不是很大，并且大多数都在集合中，则使用确定性的bit array远远胜过使用布隆过滤器。因为bit array对于每个可能的元素空间上只需要1 bit，add和query的时间复杂度只有O(1)。注意到这样一个哈希表（bit array）只有在忽略collision并且只存储元素是否在其中的二进制信息时，才会获得空间和时间上的优势，而在此情况下，它就有效地称为了k=1的布隆过滤器。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	而当考虑到collision时，对于有m个slot的bit array或者其他哈希表（即k=1的布隆过滤器），如果想要保证1%的误判率，则这个bit array只能存储m/100个元素，因而有大量的空间被浪费，同时也会使得空间复杂度急剧上升，这显然不是space efficient的。解决的方法很简单，使用k&gt;1的布隆过滤器，即k个hash function将每个元素改为对应于k个bits，因为误判度会降低很多，并且如果参数k和m选取得好，一半的m可被置为为1，这充分说明了布隆过滤器的space efficient性。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<strong style="margin: 0px; padding: 0px;"><font size="4" style="margin: 0px; padding: 0px;">三. 举例说明</font></strong></p>
<p style="margin: 10px auto; padding: 0px;">
	以垃圾邮件过滤中黑白名单为例：现有1亿个email的黑名单，每个都拥有8 bytes的指纹信息，则可能的元素范围为&nbsp;&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318572980.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002" border="0" height="21" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318584027.png" style="margin: 0px; padding: 0px; border: 0px; display: inline;" title="clip_image002" width="200" /></a>&nbsp;，对于bit array来说是根本不可能的范围，而且元素的数量（即email列表）为&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318586502.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[6]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318585390.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[6]" width="25" /></a>，相比于元素范围过于稀疏，而且还没有考虑到哈希表中的collision问题。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	若采用哈希表，由于大多数采用open addressing来解决collision，而此时的search时间复杂度为 ：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318587865.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[8]" border="0" height="62" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318595880.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[8]" width="42" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	即若哈希表半满(n/m = 1/2)，则每次search需要probe 2次，因此在保证效率的情况下哈希表的存储效率最好不超过50%。此时每个元素占8 bytes，总空间为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318595847.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[10]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318599402.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[10]" width="158" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	若采用Perfect hashing（这里可以采用Perfect hashing是因为主要操作是search/query，而并不是add和remove），虽然保证worst-case也只有一次probe，但是空间利用率更低，一般情况下为50%，worst-case时有不到一半的概率为25%。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	若采用布隆过滤器，取k=8。因为n为1亿，所以总共需要&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162318598289.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[12]" border="0" height="21" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/20110216231900208.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[12]" width="80" /></a>&nbsp;被置位为1，又因为在保证误判率低且k和m选取合适时，空间利用率为50%（后面会解释），所以总空间为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319009303.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[14]" border="0" height="39" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319003174.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[14]" width="295" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	所需空间比上述哈希结构小得多，并且误判率在万分之一以下。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<font size="4" style="margin: 0px; padding: 0px;"><strong style="margin: 0px; padding: 0px;">四. 误判概率的证明和计算</strong></font></p>
<p style="margin: 10px auto; padding: 0px;">
	假设布隆过滤器中的hash function满足simple uniform hashing假设：每个元素都等概率地hash到m个slot中的任何一个，与其它元素被hash到哪个slot无关。若m为bit数，则对某一特定bit位在一个元素由某特定hash function插入时没有被置位为1的概率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319012061.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[16]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319014536.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[16]" width="42" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	则k个hash function中没有一个对其置位的概率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319017011.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[18]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319024470.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[18]" width="65" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	如果插入了n个元素，但都未将其置位的概率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319026945.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[20]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319021057.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[20]" width="72" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	则此位被置位的概率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319023532.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[22]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319026007.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[22]" width="100" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	现在考虑query阶段，若对应某个待query元素的k bits全部置位为1，则可判定其在集合中。因此将某元素误判的概率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319038482.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[24]" border="0" height="62" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319039321.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[24]" width="127" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	由于&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319031797.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[26]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319043367.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[26]" width="168" /></a>，并且&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319041698.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[28]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319045809.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[28]" width="28" /></a>&nbsp; 当m很大时趋近于0，所以</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319059680.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[30]" border="0" height="66" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319058775.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[30]" width="408" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	从上式中可以看出，当m增大或n减小时，都会使得误判率减小，这也符合直觉。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	现在计算对于给定的m和n，k为何值时可以使得误判率最低。设误判率为k的函数为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319059614.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[32]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319062089.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[32]" width="137" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	设&nbsp;&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319068991.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[34]" border="0" height="42" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319061466.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[34]" width="49" /></a>&nbsp;， 则简化为</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319073942.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[36]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319075.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[36]" width="127" /></a>，两边取对数</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319072480.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[38]" border="0" height="21" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319071367.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[38]" width="168" /></a>&nbsp; , 两边对k求导</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319082414.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[40]" border="0" height="83" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319087921.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[40]" width="554" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	下面求最值</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319083428.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[42]" border="0" height="39" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319093395.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[42]" width="210" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319092282.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319091169.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319097233.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image004" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319103296.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image004" width="271" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319102183.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319101070.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319109085.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image006" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319111004.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image006" width="255" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319115116.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319117591.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/2011021623191166.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image008" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319122541.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image008" width="99" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319121429.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319127492.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319128331.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image010" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319134918.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image010" width="55" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319133805.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319136280.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319132343.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image012" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319143182.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image012" width="61" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319144785.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319143673.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319151688.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image014" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319158067.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image014" width="62" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319158034.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[44]" border="0" height="19" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319159637.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[44]" width="14" /></a>&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/20110216231916476.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[52]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319164554.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[52]" width="145" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	因此，即当&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319177553.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[54]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319171980.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[54]" width="76" /></a>&nbsp; 时误判率最低，此时误判率为：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319179439.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[56]" border="0" height="40" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319184946.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[56]" width="340" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	可以看出若要使得误判率&le;1/2，则：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319187421.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[58]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319181848.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[58]" width="124" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	这说明了若想保持某固定误判率不变，布隆过滤器的bit数m与被add的元素数n应该是线性同步增加的。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<font size="4" style="margin: 0px; padding: 0px;"><strong style="margin: 0px; padding: 0px;">五. 设计和应用布隆过滤器的方法</strong></font></p>
<p style="margin: 10px auto; padding: 0px;">
	应用时首先要先由用户决定要add的元素数n和希望的误差率P。这也是一个设计完整的布隆过滤器需要用户输入的仅有的两个参数，之后的所有参数将由系统计算，并由此建立布隆过滤器。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	系统首先要计算需要的内存大小m bits:</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319183767.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[60]" border="0" height="39" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319199274.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[60]" width="377" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	再由m，n得到hash function的个数：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319197289.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[52]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319207779.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[52]" width="145" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	至此系统所需的参数已经备齐，接下来add n个元素至布隆过滤器中，再进行query。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	根据公式，当k最优时：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319209142.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[66]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319219076.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[66]" width="446" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319219566.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image004[8]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319227515.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image004[8]" width="237" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	因此可验证当P=1%时，存储每个元素需要9.6 bits：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319231320.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[70]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319233238.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[70]" width="209" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	而每当想将误判率降低为原来的1/10，则存储每个元素需要增加4.8 bits：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319248745.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[72]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319248156.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[72]" width="390" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	这里需要特别注意的是，9.6 bits/element不仅包含了被置为1的k位，还把包含了没有被置为1的一些位数。此时的</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319257251.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[74]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319257533.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[74]" width="236" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	才是每个元素对应的为1的bit位数。</p>
<p style="margin: 10px auto; padding: 0px;">
	&nbsp;</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319253597.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[76]" border="0" height="33" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319256072.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[76]" width="76" /></a>&nbsp;&nbsp; 从而使得P(error)最小时，我们注意到：</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/20110216231926499.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[78]" border="0" height="39" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319266562.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[78]" width="168" /></a>&nbsp;中的&nbsp;<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319269038.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[80]" border="0" height="36" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319269877.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[80]" width="62" /></a>&nbsp; ，即</p>
<p style="margin: 10px auto; padding: 0px;">
	<a href="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319275940.png" style="margin: 0px; padding: 0px; color: black;"><img alt="clip_image002[82]" border="0" height="40" src="http://images.cnblogs.com/cnblogs_com/allensun/201102/201102162319272003.png" style="margin: 0px; padding: 0px; border: 0px; background-image: none; display: inline;" title="clip_image002[82]" width="102" /></a></p>
<p style="margin: 10px auto; padding: 0px;">
	此概率为某bit位在插入n个元素后未被置位的概率。因此，想保持错误率低，布隆过滤器的空间使用率需为50%。</p>
]]>
        
    </content>
</entry>

<entry>
    <title>Day Day Up：陈与义《临江仙》 - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/11/day-day-up-1.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1310</id>

    <published>2012-11-04T11:10:25Z</published>
    <updated>2012-11-05T01:45:44Z</updated>

    <summary><![CDATA[ 浅浅教学需要，继续复习古代诗词。 这是教会浅浅的第一首词。从小小姑娘的口中说出&ldquo;二十余年如一梦&rdquo;有另一番味道。（恰如她背诵&ldquo;只是当时已惘然&rdquo;时，似乎也能感受到些许惘然。）...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="西学东渐East&amp;West" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="诗词" label="诗词" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>
	浅浅教学需要，继续复习古代诗词。</p>
<p>
	这是教会浅浅的第一首词。从小小姑娘的口中说出&ldquo;二十余年如一梦&rdquo;有另一番味道。（恰如她背诵&ldquo;只是当时已惘然&rdquo;时，似乎也能感受到些许惘然。）</p>
]]>
        <![CDATA[<p>
	就像某些歌曲，打动人的或许只是其中的一句或几句一样，许多诗词也是如此，更高明之处在于，就是这仅仅的一句，可以营造一个场景，可以令人触景生情，可以衍生出一个故事，一段传奇。&ldquo;庄生晓梦迷蝴蝶，望帝春心托杜鹃&rdquo;，&ldquo;嫦娥应悔偷灵药&rdquo;，&ldquo;若是龙城飞降在，不叫胡马度阴山&rdquo;，&ldquo;马作的卢飞快&rdquo;，&ldquo;元嘉草草，封狼居胥&rdquo;......这些几个字十几个字所呈现的离不开文字背后典故的支持。另一种，是只言片语的意境，&ldquo;寻寻觅觅冷冷清清凄凄惨惨切切&rdquo;，&ldquo;前不见古人，后不见来者&rdquo;，&ldquo;风吹草低见牛羊&rdquo;，&ldquo;大漠孤烟直，长河落日圆&rdquo;，&ldquo;长沟流月去无声&rdquo;，&ldquo;杏花疏影里，吹笛到天明&rdquo;，&ldquo;二十余年如一梦&rdquo;......</p>
<p>
	为什么格外青睐这首词呢？不仅是出于对南北宋交替时期特殊历史背景对人（文人）心理的影响感兴趣，其实仅此一句&ldquo;忆昔午桥桥上饮，座中多是豪英&rdquo;，就令人浮想联翩了。从很早之前看的一部穿越架空历史的小说，那些人物白衣飘飘如谪仙般的人物，那种豪气干云生死相托的情意，那些壮志满怀，才情满怀，那些岁月无声，人生无奈，所有那些留在脑海中形成了难以磨灭的画卷。十年后故友重逢，回想当年的青葱岁月，纯真与懵懂，豪言壮语，拳拳赤诚，如今也只是随着岁月幻灭成脑海中的影像......那些我们热爱的、我们追求的、我们执着的、或错过的，也像那些小说故事一样，无法重来，或者重来也因蹉跎岁月而索然无味吧，哈哈。只能遐想？不会惘然。</p>
<p>
	<strong>&nbsp;临江仙&nbsp;</strong> &nbsp;夜登小楼记洛中旧游</p>
<p>
	（宋&middot;陈与义）</p>
<p>
	忆昔午桥桥上饮，</p>
<p>
	坐中多是豪英。</p>
<p>
	长沟流月去无声。</p>
<p>
	杏花疏影里，</p>
<p>
	吹笛到天明。</p>
<p>
	二十余年如一梦，</p>
<p>
	此身虽在堪惊。</p>
<p>
	闲登小阁看新晴。</p>
<p>
	古今多少事，</p>
<p>
	渔唱起三更。</p>
<p>
	<strong>【注释】&nbsp;</strong><br />
	　①此调原为唐教坊曲。最初多咏水仙。故名。后用作一般词牌。又名《谢新恩》 　《雁后归》、《画屏春》等。双调，五十八字或六十字，别体甚多，皆用平韵。 　②午桥：在洛阳城南。据《新唐书&middot;裴度传》载，裴度曾建别墅于午桥，号绿野堂，用作与白居易、刘禹锡等人的宴饮吟唱之所。　③新晴：指雨后初晴时的月色。　④渔唱：即渔歌。&nbsp;<br />
	<strong>【品评】</strong>&nbsp;<br />
	　　　这是一首抚今追昔、伤时感世这作。上片&quot;忆昔&quot;领起，所展现的是当年豪酣欢乐的生活画面，这正是申发题中的&quot;忆洛中旧游&quot;之意。而画面的中心视点则是约会饮于&quot;午桥&quot;之上的&quot;豪英&quot;。&quot;坐中尽是豪英&quot;，表明同游者无不英气逼人，豪气干云，为一时后杰。不难想象，欢饮之际，他们指点江山，激扬文字，是何等兴会淋漓。&quot;长沟流月&quot;三句刻画这群&quot;豪英&quot;欢会的环境，而着力凸现其静谧与幽美，以烘托与会者的雅趣和逸兴。&quot;沟&quot;前着一&quot;长&quot;字，使空间得以拓展；&quot;天明&quot;前着一&quot;到&quot;字，又使时间得以延伸，见出作者等人欢饮达旦。同时，不说月光映水，而说&quot;长沟流月&quot;，造语即更为生动、奇巧，又平添出几分幽约与朦胧；而&quot;去无声&quot;，则隐然若有华年盛事悄然而逝的象征意味。&quot;杏花&quot;句巧妙在不着浓墨重彩，而致力于对&quot;杏花疏影&quot;的淡勾轻勒，以切合午桥的地域特征和月夜的时域特征。涉笔至此，桥中豪英，桥下长沟，桥畔杏花，桥上明月，已构成一幅动静制宜、形神兼备的雅人高士夜饮图，而彻夜競吹的笛声则是它的余韵悠远的画外音。下片折回现实，对靖康之变所造成的旧交零落盛会难再的局面深致慨叹。融入其中不只是作者个人身世的感伤，更有国土沦丧、时局危殆的忧愤。&quot;二十余年&quot;，点明下片所追记的已是二十年多年前的往事。&quot;如一梦&quot;，则喻示了作者身经浩动、如历恶梦的真实心境。&quot;此身虽在堪惊&quot;，传达出恶梦初醒时的魂悸魄动、胆颤心惊之感，暗示他曾屡涉险境。&quot;闲登小阁&quot;句看似荡开笔墨，实则是以雨后新睛时的月色绾合今昔，抒写月色虽好而欢会已矣的伤悼之情。&quot;古今&quot;二句写古&nbsp;<br />
	　往今来多少兴与亡之事尽付诸渔唱樵歌，托出超越时空的历史感慨，使全词的意蕴更趋深广与厚重。</p>
<p>
	<strong><span style="font-size: 14px;">另</span></strong>一首我个人非常喜欢的来自陈与义的诗《咏牡丹》。可能是出于对那段特殊历史的不同感触，这一时期的诗文、书法绘画都是我忒额关注的。</p>
<p>
	<strong>咏牡丹&nbsp; </strong>（宋&middot; 陈与义）</p>
<p>
	一自胡尘入汉关，十年伊洛路漫漫。<br />
	青墩溪畔龙钟客，独立东风看牡丹。</p>
<p>
	<strong>赏析</strong><br />
	　　作者陈与义是南北宋相交时的著名人。这首诗是作者南渡后于绍兴六年(1136年)居住在青墩（今浙江桐乡县北，与乌镇隔水相望）时所作，距靖康二年(1127年)金兵攻陷汴京正好十年。&quot;十年伊洛路漫漫&quot;中&quot;路漫漫&quot;既是说离自己的家乡洛阳（伊水、洛水）是路途遥远，也是说家乡被金兵占领的时间也已经很长久了（十年）。<br />
	　　在这首诗里，作者表面说的是面对春日盛开的青墩牡丹，自己独自一个在观赏，实际上想说的是什么时间我才能再回到故乡去观赏天下驰名的洛阳牡丹。但想到眼前的景况，时间在无情地流逝，自己已变得老态龙钟，然而家国破碎故土依然难回时，作者通过牡丹而强烈地表达出了对故乡深切无尽的思念及对前景的无望与悲苦万千的愁绪!</p>
]]>
    </content>
</entry>

<entry>
    <title>Day Day Up：诗经·卫风·伯兮 - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/05/day-day-up-20120516.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1309</id>

    <published>2012-05-16T11:46:36Z</published>
    <updated>2012-05-16T10:59:37Z</updated>

    <summary><![CDATA[&nbsp;朗朗上口，韵律优美，许多名句耳熟能详都出自《诗经》。遗憾却未认真的学习和诵读过。教学需求，重新学习。来自《卫风·伯兮》，很好听，需细品。纪念失眠夜，感谢有诗经！...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="真水煮冰Soliloquy" scheme="http://www.sixapart.com/ns/types#category" />
    
        <category term="西学东渐East&amp;West" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="文学诗经" label="文学 诗经" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>&nbsp;朗朗上口，韵律优美，许多名句耳熟能详都出自《诗经》。遗憾却未认真的学习和诵读过。</p><p>教学需求，重新学习。来自《卫风·伯兮》，很好听，需细品。</p><p>纪念失眠夜，感谢有诗经！</p>]]>
        <![CDATA[<p>伯兮朅兮，邦之桀兮。</p><p>伯也执殳，为王前驱。<br /></p><p>自伯之东，首如飞蓬。</p><p>岂无膏沐？谁适为容！<br /></p><p>其雨其雨，杲杲出日。</p><p>愿言思伯，甘心首疾。<br /></p><p>焉得谖草？言树之背。</p><p>愿言思伯，使我心痗。</p><p>读音提示：<br />朅（怯qiè） 桀（杰jié） 殳（殊shū） 适（迪dí）? 杲杲（搞gǎo） 谖（宣xuān）痗（昧mèi） </p><p>题解：</p><p>这诗写一个妇人思念她的从军远征的丈夫。她想象丈夫执殳前躯，气概英武，颇有一些骄傲之感，但别后刻骨的相思却是够受的。在她寂寞无聊的生活里，那相思不但丢不开，甚至倒成为她宁愿不丢开的东西了。</p><p>【译文】<br />夫君夫君，邦之英杰。执仗执枪，保家卫国！<br />夫君赴东，乱发如蓬。无人悦己，为谁而容！<br />盼雨盼雨，又见日烈。惟念夫君，头痛欲裂！<br />忘忧草啊，哪里去找？惟念夫君，忧心如捣！</p><p><a href="http://baike.baidu.com/view/162597.htm">余冠英</a>今译:<br />我的哥啊多英勇，在咱卫国数英雄。我哥手上拿殳杖，为王打仗做先锋。<br />&nbsp;打从我哥东方去，我的头发乱蓬蓬。香油香膏哪缺少，叫我为谁来美容！<br />&nbsp;好像天天盼下雨，天天太阳像火盆。一心只把哥来想，头痛难忍又何妨？<br />&nbsp;哪儿去找忘忧草？为我移到北堂栽。一心只把哥来想，病到心头化不开。</p><p>赏析：</p><p> 战争会破坏很多东西，而它首先破坏的是军人自身的家庭生活。军人尚未走到战场，他们的妻子已经被抛置在孤独与恐惧中了。她们的怀念不是一般的怀念，那永远是充满不安和忧虑的。等待出征的丈夫回来，几乎成为她们生活中唯一有意义的内容。</p><p>　　然而战争又总是不可避免的。不管一场正在进行的战争其必要性如何、能否被评判为"正义"，从事这场战争的群体和它的领导者，总是要勉励群体中的成员为之付出最大的努力、最大的牺牲。国家给军人以荣誉，使他们认为自己付出的努力和牺牲是值得的；这荣誉也会影响他们的家人----尤其是妻子，使她们认为家庭生活的破坏以及自身的痛苦都是有价值有意义的。因此，写妻子怀念从军的丈夫的诗篇，通常会包含两方面的内容：为丈夫而骄傲----这骄傲来自国家、来自群体的奖勉；思念丈夫并为之担忧----这种情绪来自个人的内心。</p><p>　　《伯兮》就是典型的这种诗篇。（<a href="http://qyrs.depart.hebust.edu.cn/qiyishuwu/ShowArticle.asp?ArticleID=948"> ...更多赏析</a>）</p><p>观点：</p><p>选择的同时也意味着放弃，深明大义是一种矛盾。引以为骄傲的，同时也是需要掩饰脆弱的。诗中女子于伯如是，现代女性对于丈夫何尝不是呢？对于译文，还是喜欢四字成吟的，一咏一叹，别有韵味。</p><p>&nbsp;</p>]]>
    </content>
</entry>

<entry>
    <title>馆中窥宝之：百衲本二十四史(1933) - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/05/1933.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1308</id>

    <published>2012-05-15T13:19:21Z</published>
    <updated>2012-05-16T08:41:10Z</updated>

    <summary><![CDATA[图书馆的宝贝很多，我会慢慢发觉，一一了解，合适的时机就会同大家分享、展示。今天的主角是大体积的----1933年商务印书出版社百衲本二十四史。&nbsp;...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="西学东渐East&amp;West" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="古籍特藏" label="古籍 特藏" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>图书馆的宝贝很多，我会慢慢发觉，一一了解，合适的时机就会同大家分享、展示。</p><p>今天的主角是大体积的----1933年商务印书出版社百衲本二十四史。</p><p>&nbsp;</p>]]>
        <![CDATA[<p>宝贝名称： 《<a href="http://baike.baidu.com/view/776905.htm">百衲本二十四史</a>》</p><p>出版年代：民国二十二年（1933）</p><p>出版者：商务印书馆</p><p>馆藏情况：影印本 纸本 线装 共820册。馆藏应该是足本，带出版时放置书的<a href="http://baike.baidu.com/albums/776905/776905/0/0.html#0$d8b8c92ac80db605d42af1da">原装樟木套箱</a>，无虫蛀，已出现霉斑。部分柜锁锁住，无法打开。柜底部板微裂。</p><p>对策：</p><p>开锁，但保护原装箱的完好，打开柜门，清点并提供阅览。注意防潮除湿，保护全套的完整性。修复书箱。</p><p>&nbsp;</p><p>简介：</p><p>·&nbsp;&nbsp; <span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">全套</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">二十四史</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">，到清末民初的主要有版本：清乾隆年间的武英殿刻本、清朝末年由金陵、淮南、浙江、江苏、湖北五个书局刻印的</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">局本</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">，但校刻不精，错误不少。</span></p><p><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">著名国学大师商务印书馆创始人张元济先生为求史之真，纠正殿本缺失，耗费巨资广搜各史的宋元善本，采用当时最先进的摄影制版技术，经数十年收集各史较早刻本（其中宋元</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">15</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">种，元本</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">6</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">种，明清初刻本</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">3</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">种）加以影印，历经</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">8</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">年完成《百衲本二十四史》，被史学界一致公认为最佳全本正史，在中国五千年文明史上有着重要地位与珍贵价值。</span></p><p><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span>·&nbsp;&nbsp; <span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">张元济先生总结前人校书经验，以</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">书贵初刻</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">为选择底本的指导思想，千方百计地搜访一流善本，但又不拘泥于宋元旧椠，而是反复对勘，择善而从。所以《百衲本二十四史》选用的版本，都是最早最好的本子，而且多数是精心选取几个不同版本配补而成的。更难得的是，张元济先生在《百衲本二十四史》的辑录过程中，创立了古籍整理有关门类的一整套学术规范。他在前人校书经验的基础上运用科学的校勘方式，从千头万绪的纷杂版本中，提纲挈领，理出版本源流，厘定文字得失，正确判定版本价值，作为选择底本的依据。《百衲本二十四史》出版后成为全国学界一大共同话题，当时社会各界佳评如潮，全国各大报章连篇累牍发表大量评介文章，莫不予以高度赞誉，堪称一时之盛。</span></p><p><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span>·&nbsp;&nbsp; <span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">原北京大学校长，著名教育家蔡元培先生评价为</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">博观精勤之成绩所以嘉惠学子益无限量</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">。史学家傅增湘盛赞</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">所采获者皆前人未见之书，故其定论者多千古未发之覆</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">。文献学家张舜徽在其《中国文献学》中认为，</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">从此全史出现了最标准的本子，可据以订伪补缺，对史学界的贡献为最大</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">。现代著名历史学家王绍曾先生评价：</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">是宋元以来全史善本的一次大集结，是宋元以后全史最佳的汇印本。搜罗旧本之广，影印之精，在历史上都是空前的。</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span></p><p><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;=""></span>·&nbsp;&nbsp; <span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;"></span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">可以说《百衲本二十四史》的出版是中国史学上的一座丰碑。中国历史上刊印全套</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">二十四史</span><span style="color: black; font-family: ;" lang="EN-US" 9pt;?="" Arial?,?sans-serif?;="">"</span><span style="color: black; font-family: 宋体; font-size: 9pt; mso-ascii-font-family: Arial; mso-fareast-font-family: 宋体; mso-fareast-theme-font: minor-fareast; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">出现了第三种版本而且是最为出色的一种版本。</span></p><p>(介绍文字引自<a href="http://baike.baidu.com/view/776905.htm">百度百科</a>）</p><p><font color="#000000" size="3" face="宋体">

</font></p>]]>
    </content>
</entry>

<entry>
    <title>馆中窥宝之：清国北京皇城写真贴 - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/05/post-133.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1307</id>

    <published>2012-05-14T11:25:38Z</published>
    <updated>2012-05-16T08:17:47Z</updated>

    <summary><![CDATA[宝贝名称：&nbsp;《清国北京皇城写真贴》出版年代：明治39年（1906）出版者：东京小川一真出版部出版馆藏情况：我馆馆藏为第427号。 书套彻底开裂，破损严重；书页有霉变，页面霉斑很多，有缺页，（据专家查对）约10页左右对策：展示，研究，更需要保护。霉斑无法去除，任其继续下去，书籍可能被毁。防潮除湿很重要。...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="西学东渐East&amp;West" scheme="http://www.sixapart.com/ns/types#category" />
    
    <category term="特藏古籍" label="特藏 古籍" scheme="http://www.sixapart.com/ns/types#tag" />
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>宝贝名称：&nbsp;《清国北京皇城写真贴》</p><p>出版年代：明治39年（1906）</p><p>出版者：东京小川一真出版部出版</p><p>馆藏情况：我馆馆藏为第427号。 书套彻底开裂，破损严重；书页有霉变，页面霉斑很多，有缺页，（据专家查对）约10页左右</p><p>对策：</p><p>展示，研究，更需要保护。霉斑无法去除，任其继续下去，书籍可能被毁。防潮除湿很重要。</p>]]>
        <![CDATA[<p>介绍：</p><p>·  《清国北京皇城写真帖》，为日本东京帝室博物馆于1906年编辑的一部关于清末北京皇城宫殿及皇家园林的摄影集。</p><p>·  该书缘起于庚子事变八国联军攻入北京后，东京帝国大学助教工学博士伊东忠太，大学院学生土屋純一，助手奥山恒五郎，及摄影师小川一真来京，对紫禁城及其它一些宫殿园囿等进行实地拍照，伊东忠太进行解说词撰写。</p><p>&nbsp;</p><p>·   该书采用珂罗版限定印制了5百部，，摄影技术极佳，印刷质量上乘，每幅照片皆附有文字说明，对其位置、尺寸、材料、形状等进行了详细的记录，附以中、英、日说明各一份。</p><p>·  《清代北京皇城写真帖》内容包括北京城、紫禁城内九重殿门、西苑、万寿山、天坛、先农坛、日坛、雍和宫、黄寺、文庙十大部分。当时东京帝室博物馆 （今"东京都国立博物馆"）对此事予以资助，后一百七十余幅照片归其保藏。</p><p>特点：</p><p>·  该书属于100多年前的珍贵史料，是研究我国古代文化、历史、建筑、宫廷、园囿、工艺、文物等的珍贵的历史资料。</p><p>·  出版于1911年前，属于古籍范畴。</p><p>·  该书采用4开大尺寸，图版清晰，度量使用了寸、尺、丈的度量单位。</p><p> </p><p>补充：</p><p>·  鉴于该书照片具有非常珍贵的史料和文化价值，2000，2009年曾再版，甄选其中部分照片缩印，书名改为《<a href="http://book.douban.com/subject_search?search_text=%E6%B8%85%E5%9B%BD%E5%8C%97%E4%BA%AC%E7%9A%87%E5%9F%8E%E5%86%99%E7%9C%9F%E5%B8%96&amp;cat=1003">清代北京皇城写真贴</a>》。</p><p>·&nbsp;&nbsp; 照片拍摄的原有，一说是<a href="http://baike.baidu.com/view/61940.htm">庚子事变</a>后，这些日本人来京考察；另一些资料提到了另一个曾在北京开照相馆的日本人山本赞七郎，"1900年八国联军攻入北京时，他曾同小川一真、柴田常吉、深谷驹吉等随军记录庚子事变实况"，所谓"考察"其实就是随军摄影。事实上，1894年，小川一真作为随军摄影师，曾参与了甲午海战的拍摄，还留下了"经远号"沉默瞬间的照片（源自<a href="http://blog.sina.com.cn/s/blog_572171680100p1z2.html">marksman的Blog</a>）。</p><p>·    网上看到有人拍摄了全本照片，自己也省了事，感兴趣的可以去<a href="http://bbs.voc.com.cn/topic-2263098-1-1.html">华声论坛</a>或者豆瓣一位叫<a href="http://www.douban.com/photos/photo/1146695249/">白纸包面氯碱化</a>的朋友处看到书中内容哦，此外，<a href="http://www.douban.com/photos/photo/1146695249/">白纸包面氯碱化</a>应该是北京的吧，对照片和现存状况进行的对比和文字，给人许多触动。</p><p>&nbsp;</p><p>·    小川一真(OGAWA  KAZUMA),1860-1929.日本摄影师，生于幕末忍藩（现埼玉县行田市）。明治十五年只身留学波士顿，学习珂罗版印刷术和干版制造法。回国后作为专业摄影师活跃于写真舞台，有诸多反映名胜古迹、民俗、文物、战争的作品。主要作品有出版物大型影集《日清·日俄战争》、《明治天皇的葬礼》、《清国皇城写真帖》等。其中记录与中国有关的重大历史事件的内容有中日甲午战争、八国联军侵华战争、日俄战争等。记录这些风情、建筑、事件、战争场面的照片，已经成为我们研究近现代史不可或缺的珍贵影像资料。有些当年的景致已成绝迹，如皇城建筑最南面的一道门，明代为大明门，清代保持原貌，只将门额改为大清门。民国建立后改为中华门，现在该建筑已不复存在。太和殿殿内原挂有"建极绥猷"匾额，现今我们看到的太和殿原状，就是朱家溍先生依此小川一真的照片为蓝本复原的。<span style="font-family: 宋体;" lang="EN-US" xml:lang="EN-US">1910年，日本政府为表彰小川一真在干版照片国产化实验中所取得成就，授予日本"帝室技艺员"的称号。而</span>日本人最熟悉的旧版1000日元上的夏目漱石像就是小川一真拍摄的。</p><p> </p><p> </p>]]>
    </content>
</entry>

<entry>
    <title>图书馆淘宝记之二：拿什么拯救你 - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/05/post-131.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1304</id>

    <published>2012-05-11T15:47:08Z</published>
    <updated>2012-05-14T06:11:28Z</updated>

    <summary><![CDATA[上回说到一件读者服务的小事，让我产生了古籍普查的想法，可是如此大规模的工作，其复杂程度是不可估量的。我馆前些年就意识到了古籍和民国书籍保护的重要性，已发动全体员工在书库中抽取49年前出版的图书，颇见成效。但是抽出的书却没有更多人力进一步整理暂时堆放在一件房间里，状态每况愈下。如此成堆的书，有些甚至更早期抽出保护，没有书目记录，如何调查？更何谈普查了。&nbsp;...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="无关图情Info-lib" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>上回说到一件读者服务的小事，让我产生了古籍普查的想法，可是如此大规模的工作，其复杂程度是不可估量的。我馆前些年就意识到了古籍和民国书籍保护的重要性，已发动全体员工在书库中抽取49年前出版的图书，颇见成效。但是抽出的书却没有更多人力进一步整理暂时堆放在一件房间里，状态每况愈下。如此成堆的书，有些甚至更早期抽出保护，没有书目记录，如何调查？更何谈普查了。</p><p>&nbsp;</p>]]>
        <![CDATA[<p><font face="宋体"></font> 契机++</p><p>限于人力，我们部门成立的之后一直没有对49年前出版物做调查，适逢本部空间紧张，领导决定所有抽调出来的49年前旧书运往嘉定校区，开辟专门区域，扫描上架。通过嘉定同事的努力，近7000种中、西文旧书上架了，一些没有记录的书被单独放置，大大方便了我们的调查工作。这批在"特藏"馆藏地短暂逗留的书籍得到了保护，但是另一些通过目录操作转移到"特藏"的旧书，至今未见到实体书的踪影，估计"尸骨难存"了。</p><p>另一个契机是我馆加入了CADAL计划，需要抽出一些其他馆没有的书籍进行数字化工作，曾经在特藏馆藏地的书籍约70多本，工作人员在嘉定库中只找到两三本，于是诉诸我们。我们也想借此机会看看上好架的民国旧书，于是淘宝从本部淘到了嘉定。</p><p><font face="宋体"><span style="color: rgb(51, 51, 51); font-size: 10pt; mso-ascii-font-family: Arial; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">民国书----拿什么拯救你？</span></font></p><font face="宋体"><p><span style="color: rgb(51, 51, 51); font-size: 10pt; mso-ascii-font-family: Arial; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">看到书架上按照索书号排列好的1949年前出版物，我有些激动，也有些无奈。这么多书，比我想象中多很多。对于甄选、分类、普查的我们来说需要逐本调研，这些书中一半以上是西文，不乏德文，法文以及少数北欧文字。此外，民国时期出版的大部分图书酸化严重，甚至有些书连简单的翻页都会造成书页碎成渣，调研以及保护工作迫在眉睫。</span>当然CADAL的找书对于我们的敏感度来说不是什么难事，很快就解决了50多本，通过多次前往嘉定摸底调查，CADAL的书目基本都找到了。可是民国旧书，让我拿什么拯救你？</p><p>民国时期（1912到1949出版）是中国历史上重要而特殊的一环。其中经历了社会动乱，战争等因素，保存的文献数量有限。民国文献的纸张寿命相对较短，只有50-100年，而且酸化严重，酸化令书籍翻动就会碎成片渣，民国书藏书量大的国图，重庆图书馆，上图等都面临着同样的难题；民国旧平装装帧简单，封面易磨损破坏、脱落。我馆嘉定特藏（民国）书籍是目前最为脆弱的文献，但其中不乏一些具有收藏价值书籍。国图将这类革命历史文献，和近现代各界名家手稿的书目称为"新善本"（见国图新善本数据库）。对于酸化情况，通常采用脱酸处理（浸泡溶液，或者液体喷雾），成本都比较高，还有些会采用塑封膜包裹，隔绝和空气中氧气的接触，来减缓书页的酸化。随着《民国籍粹》的出版，民国文献的使用问题得以解决，但是针对民国文献的保护一直困扰各大图书馆。针对我馆实际情况，我建议挑选较为珍贵的做修复和脱酸处理，其余按照文献重要等级分级别放入书柜，设置合适环境，尽量防止继续酸化。这项工作仅我们部门的人力，不是很快可以完成的。至于4000多种西文书籍，去嘉定淘宝的同时，我们也在请助管同学根据目录中的现有信息进行调研，补充、更正每一本书的完整信息，并在各大图书馆的馆藏情况，希望对挑选珍本书籍有所助益。仅此而已，其他工作，目前只能望天兴叹了～</p><p>积跬步，得惊喜</p><p>去嘉定是很辛苦的，收获是颇丰的。我们对嘉定同事们挑出的无书目信息书籍和破损书籍做了登记和目录，并拍照留存；经整理，仅这部分书籍就有160种，其中不乏古籍和珍惜版本的民国书。此外，我们发现有些成系列书籍缺本或者分散放置，在其他馆藏地不仅发现了部分套系中缺失的单册，也在保存本库发现了一些出版年不明的线装书和古籍影印本，其中不乏出版年代考证为民国时期的线装书。经了解，线装书籍出版年通常在第一本，或最后一本，其余书籍无出版信息，造成工作人员无法判断出版年代；也有以非公元纪年方式的出版日期，如民国纪年，昭和纪年等，普通工作人员也无法判断年代。考虑到这些情况，普查的还有一项工作就是扫库----将散落在本部书库或嘉定的保存本书库中的需要的书籍，挑出调拨到相应馆藏地。我们在嘉定保存本库收获惊人。大量的缺第一或最后一本的民国线装书，地方志，还有我们在本部没有淘到的开列清单的书籍。<p>淘宝一路从<span style="color: rgb(51, 51, 51); font-size: 10pt; mso-ascii-font-family: Arial; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">流通库到阅览室，从本部淘去嘉定。相比在本部的充裕时间，后期在嘉定保存本库的淘宝近似于扫架。我点，助手取书，我们再将书放置在书架一侧，很快，书架一端的地上堆起了小山。尤其是大尺寸的艺术类图书，非常沉重，我们简单翻阅，现场手机上网搜索，确定去向。当然这种扫库还很粗略，时间所限未能全部抽出所需，但是仅此一次，从嘉定运来了</span><font face="宋体"><span style="color: rgb(51, 51, 51); font-family: ;" lang="EN-US" Arial?,?sans-serif?;="" 10pt;?="">4000</span><span style="color: rgb(51, 51, 51); font-size: 10pt; mso-ascii-font-family: Arial; mso-hansi-font-family: Arial; mso-bidi-font-family: Arial;">册左右的民国线装书，以及艺术类书籍。当然本部还有些宝贝，已被阅览部同仁早早下手保护，我们可以坐享其成，只需调研、搬运和整理，相对已是非常便捷</span>。</font><font size="2">直至今年初，也是寒假的前几日，一整车书从嘉定运来，也交接到我们部门。至此，第一回合的普查算告一段落。</font><p>为何着急挑选，运输书籍？普查工作是否算结束了呢？西文书暂时无法企及，那中文呢？......淘宝还在继续，宝阁初建中。</p></font><p><p></p>]]>
    </content>
</entry>

<entry>
    <title>移动和WAP应用 - Thinkjam Labs</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/labs/2012/05/wap.html" />
    <id>tag:www.thinkjam.org,2012:/labs//5.1303</id>

    <published>2012-05-11T02:52:25Z</published>
    <updated>2012-05-11T03:13:55Z</updated>

    <summary> 还记得5年多前，第二个Moto的手机丢了之后，在犹豫选择便捷式的钢笔型手机，还是大屏幕手机，在黑莓、Palm等机型可供选择下，的确不是很动心，关键在于键盘式输入在手机上非常不便，直到Iphone的出现。我的第一代Iphone拿到手里时已到2007年8月，后因电池故障，变成了板砖，不得不出资修理，但是就使用感受来说，是革命的，值得的。5年前，甚至三年前，谁也不会想到定位小资的Iphone会如此大行其道。IC2012的大会现场，70％的参会者手持大屏幕手机，其中过半都是Iphone。于是商家针对大屏手机用户的移动服务不断在推陈出新，我们图书馆也做过移动阅读等项目。就我所知，许多网站，平台推出了手机版，本人用得比较多的是支付宝，点评，亚马逊，淘宝，京东等，而另一些公司或个人则推出了许多基于WAP的应用，我查查，有道词典，QQ音乐等都挺好用，想做一个小调查，大家都在用什么手机？哪些应用是你目前使用最多的？还有想要却没有的功能和应用吗？...</summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="New Fields" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/labs/">
        <![CDATA[<p> 还记得5年多前，第二个Moto的手机丢了之后，在犹豫选择便捷式的钢笔型手机，还是大屏幕手机，在黑莓、Palm等机型可供选择下，的确不是很动心，关键在于键盘式输入在手机上非常不便，直到Iphone的出现。</p><p>我的第一代Iphone拿到手里时已到2007年8月，后因电池故障，变成了板砖，不得不出资修理，但是就使用感受来说，是革命的，值得的。5年前，甚至三年前，谁也不会想到定位小资的Iphone会如此大行其道。IC2012的大会现场，70％的参会者手持大屏幕手机，其中过半都是Iphone。</p><p>于是商家针对大屏手机用户的移动服务不断在推陈出新，我们图书馆也做过移动阅读等项目。就我所知，许多网站，平台推出了手机版，本人用得比较多的是支付宝，点评，亚马逊，淘宝，京东等，而另一些公司或个人则推出了许多基于WAP的应用，我查查，有道词典，QQ音乐等都挺好用，想做一个小调查，大家都在用什么手机？哪些应用是你目前使用最多的？还有想要却没有的功能和应用吗？</p>]]>
        
    </content>
</entry>

<entry>
    <title>图书馆淘宝记之一：一件小事所引发的 - 墨神的凡龛</title>
    <link rel="alternate" type="text/html" href="http://www.thinkjam.org/mercury/archives/2012/05/post-129.html" />
    <id>tag:www.thinkjam.org,2012:/mercury//3.1301</id>

    <published>2012-05-08T14:01:07Z</published>
    <updated>2012-05-11T05:51:15Z</updated>

    <summary><![CDATA[&nbsp;图书馆有什么宝可淘？此淘宝非各位达人"淘宝购物"之淘宝，而是在浩瀚书海中淘出珍贵的，有价值的书籍或古籍的淘宝。而说起淘宝，必不能略过图书馆"宝阁"（特藏研究室）的建设----这与特藏部的起源，以及我个人生命中重要的里程也紧密相连。...]]></summary>
    <author>
        <name>墨神</name>
        <uri>http://www.thinkjam.org/mercury/</uri>
    </author>
    
        <category term="无关图情Info-lib" scheme="http://www.sixapart.com/ns/types#category" />
    
    
    <content type="html" xml:lang="en" xml:base="http://www.thinkjam.org/mercury/">
        <![CDATA[<p>&nbsp;图书馆有什么宝可淘？此淘宝非各位达人"淘宝购物"之淘宝，而是在浩瀚书海中淘出珍贵的，有价值的书籍或古籍的淘宝。而说起淘宝，必不能略过图书馆"<a href="http://www.lib.tongji.edu.cn/infoservices/netshow/hmhb2011/index.html">宝阁</a>"（特藏研究室）的建设----这与特藏部的起源，以及我个人生命中重要的里程也紧密相连。</p>]]>
        <![CDATA[<p>缘起----中华再造善本</p><p>最初规划古籍与特藏研究室，多是因为获赠"中华再造善本"丛书，非常珍贵，有需要单独放置，更好提供服务、利用，并有效开发挖掘古代文化资源。2009年，图书馆古籍与特藏研究室具有了筹建的意向。2010年筹建之初，我们的很多精力放在了整体的规划，家具调研、设计之上，调研规划了多种方案，设想打造成古代文化基地----博物馆兼图书馆风格，可购买高仿古代青铜器、陶瓷、书画、服饰等，结合实物展示教育读者，还定制了展柜，后来多方原因，计划搁浅。2010下半年，小可幸得一女，开始休假，部门仅剩一人主力，一人新进，开始尝试准备馆藏精品文献的展览，2011年，恢复上班，加入展览筹备，团队重新，多次推翻浅显哗众的展品，重新甄选有分量的古籍（再造善本）。为了着力打造"中华记忆"文化专题活动，我们自修古文化，准备古代书画现场讲解，并精心准备并推出"<a href="http://www.lib.tongji.edu.cn/infoservices/netshow/hmhb2011/index.html">翰墨鸿宝----馆藏古籍与中华传统书画精品展</a> "展览，将古籍特藏的主要精品进行了梳理，展览广受好评，也令读者得悉，图书馆还有这么一个收藏精品好书的"宝阁"。部门初具形态，从特藏与策展小组（2)人，壮大成长为发展规划与特藏部（3）人，呵呵。</p><p>契机----一件小事</p><p>2011年7月初，学期末的最后一天，十楼北边搬迁结束了装修在即，我们的忙碌终于告一段落，一件小事的发生为古籍与特藏的发展的翻开了新的一页。 </p><p>一个博士因得知特藏，为寻找他之前看过的一些书，通过询问来到我们的办公室。办公室因安置在阅览室里，在这临近下班也是本学期放假前的最后一刻中，到处堆放了打包的书籍。我耐心接待他，通过交流得知他在寻找一些曾经看过的古代建筑装饰的图书，我手边正有几分钟前作最后清理时打包好的几本厚重的日文书籍----书套残破，落满灰尘，如此不起眼的躺在角落，有些日子了。一一拆给他查看，居然就是这几本，书中有着精美的建筑装饰图案。王博士如获至宝，毕业前重温这本书的愿望得以实现。得知还有其他类似的书，我也积极协助他到其他馆藏地和阅览室寻找，未果。当时就产生了这样的想法，这样厚重又珍贵的书，如果都放在特藏研究室，读者就不必因借阅带着沉重的书而不便，图书馆也可以将珍贵资料得以更好的保存，一经交流，王博士很感动，愿将他的想法建议和记忆中的书籍清单发给我们。拿到清单的一刻我很激动。一则，王博士很认真的回忆了他记忆中的好书，列出书目并附介绍，他寄希望于交流中我提出的"保护、集中、专设阅览空间、方便阅读"的想法；其二，因为那么多图集，都非常珍贵，许多是民国时期出版，甚至在文革期间已被破坏不存的建筑保护类原始资料，这些都曾是图书馆馆藏，也是图书馆的宝藏；其三，有些根本无法获取数据信息，甚至在拍卖网站上不乏盖有图书馆章的此类书籍高价出售。保护工作义不容辞，刻不容缓。可是如何保护？首先要做的是收集。</p><p>淘宝</p><p>检索目录是一个途径，恰似淘宝购物；此外就是现场淘，但凡穿越书库，都会在库里"淘宝"，一些线装民国书籍，一些王博士开列清单的珍贵书籍，一些艺术类一版一印书籍都从成堆的旧书架上转移到了我们研究室。拿不动时，部门的两位小姑娘都成了我的劳力，手搬，车推，无所不用。对于古籍和珍贵的书，我具有独特的敏感度，就像葛朗台看到金子一样，每次收集来老版本或者艺术书籍，都会格外有成就感。就在这种零星淘宝之后，办公室（阅览室）空余的桌面逐渐堆满了"淘宝"成果，本部虽不是无可再淘了，但是就专业的角度，我们查阅过目录目录和库中状况对应不足；就操作角度，虽针对建筑类，但是其他类，尤其是民国线装书，史料类书籍等都有收获。这在特藏规划初期是始料不及的，也引发了我的另一个"可怕"的念头----普查。</p><p>一件小事引发的的结果，从找几本书变成了全馆范围的古籍普查，恰似<a href="http://baike.baidu.com/view/1180.htm">蝴蝶效应</a>（The Butterfly Effect）----蝴蝶在<a href="http://baike.baidu.com/view/43791.htm" target="_blank">热带</a>轻轻扇动一下翅膀，遥远的国家就可能造成一场飓风。不由得人不信，这件找书的小事是一个契机，也给特藏古籍建设带来一线光，向着光的方向，还有什么未知惊喜等着我们？且听后续故事。</p>]]>
    </content>
</entry>

</feed>
