为您找到相关结果630个

网址URL中特殊字符转义编码 - Lai18.com IT技术文章收藏夹

引号以及<> 引号和尖括号通常用于在普通文本中起到分隔Url的作用 # 通常用于表示书签或者锚点 % 百分号本身用作对不安全字符进行编码时使用的特殊字符,因此本身需要...
www.lai18.com/content/21852...html 2017-2-4

文本分类标准测试集reuters-21578的预处理 - Lai18.com IT技术...

原文:http://blog.163.com/andy_tsg/blog/static/1617002462010521027588/前一个月在赶一篇准备投CIKM 2010的关于transfer learning 和文本分类的paper。...
www.lai18.com/content/17190...html 2014-8-13

文本情感分析 - Lai18.com IT技术文章收藏夹

给出一系列文本,判定它们的情感倾向性(positive or negative)。一般都会采用机器学习的算法,要求有训练数据和测试数据。处理训练数据得到一个model,使用...
www.lai18.com/content/24613...html 2016-1-18

Linux中文本处理命令sed的使用示例分享 - Lai18.com IT技术文章...

sed对文本的处理很强大,并且sed非常小,参数少,容易掌握,他的操作方式根awk有点像。sed按顺序逐行读取文件。然后,它执行为该行指定的所有操作,并在完成请求的修改...
www.lai18.com/content/54480...html 2017-1-25

LaTeX完整例子_参考文献、图、表和公式 - Lai18.com IT技术文章...

\section{朴素贝叶斯}有以下几个地方需要注意: \begin{itemize} \item 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如...
www.lai18.com/content/18918...html 2017-2-17

C++中Txt文件读取和写入(方法汇总) - Lai18.com IT技术文章收藏夹

二进制文件比ASCII文件简单, 但有个缺点是无法用文本编辑器编辑。 接着, 我解释一下ifstream 和ofstream 对象的其他一些方法作为结束....
www.lai18.com/content/14153...html 2017-1-22

《机器学习系统设计》之应用scikit-learn做文本分类(上) - Lai18....

为了将原始文本转换成聚类算法可以使用的特征数据,首先需要使用词袋(bag-of-word)方法来衡量文本间相似性,最终生成每个文本的特征向量。...
www.lai18.com/content/15167...html 2017-1-19

Linux文本搜索工具grep使用详解 - Lai18.com IT技术文章收藏夹

一、grep (缩写来自Globally search a Regular Expression and Print)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。Unix的grep家族...
www.lai18.com/content/3172...html 2017-1-18

HTTP/1.1协议翻译 - Lai18.com IT技术文章收藏夹

另外,如果文本使用的字符集并不使用13,10代表CR,LF,就象在一些多字节字符集那样,那么,HTTP允许使用其对应的字节码代表该字符。这种灵活性3.7.2多部分类型MIME...
www.lai18.com/content/104309...html 2017-2-17

Mac上通过Linux命令行批量查找和替换文本 - Lai18.com IT技术文章...

一般在本地电脑上批量替换文本有许多工具可以做到,比如Emeditor,sublime text ,但在linux和mac上相关的编辑器有这个功能的不多,另外大多服务器上都是无图形界面的,...
www.lai18.com/content/7017...html 2017-1-28