找到相关内容 2
基于.NET的分词软件设计与实现V4.0--使用SortedList提高分词效率
隔了一段时间,忙其他的去了,下面继续偶之前的分词软件。   在之前的3个版本里,我们已经实现了分词的基本功能,并对其合理性等作了大量的测试评估工作,但是性能的提升还很不如意,所以这里我提出了使用SortedList提高分词效率的方案。   C#中提供了众多集合类的数据结构,如大家常用的List<T>,Dictionary<T>等,这里我将着重介绍一下SortedList,并
http://cyqdata.cn/cnblogs/article-detail-41166 
基于.NET的分词软件设计与实现V5.0--使用Hashtable和HashSet&lt;T&gt;提高分词效率
上篇使用了SortedList,对分词的性能有了显著的改进,但是有一点偶没有提,那就是构造词典的时间,由于SortedList需要保证元素的有序性,所以对于我使用的20+万的词典来说,构造时间也达到了10秒左右,因此与之前的三个版本相比,虽然分词的性能大幅提升,但总的时间并没有什么改进,所以使用SortedList的方案自然也不可行,那让我们看看之前提到的Hashtable表现如何。 一、Hash
http://cyqdata.cn/cnblogs/article-detail-41162