Webinfomall是北京大学网络实验室从2001年开始建设的中国网页档案馆.迄今,它已经收藏了自2002年初以来出现在中国互联网上的近30亿网页,而且以每天100~200万网页的速度在不断增加.这些网页不仅来源于不同的URL,而且还包含同一个URL的不同内容版本,其中许多内容目前在中国互联网上已经不复存在.如何在这样一个海量信息系统中开展有效的信息挖掘是我们面对的一个基本问题.本文描述一个实验性系统(HisTrace)框架.该系统旨在支持人们从Webinfomall中尽量准确、完整地提取与重要历史事件相关的网络新闻报道,并按照报道发生的时间顺序将它们不重复地展示出来.由于Webinfomall的海量性,也由于网络信息的复杂性和随意性,这其中有不少挑战.本文对其中的主要环节进行了分析.最后,我们简要介绍了系统的初步实现情况.国家自然科学基金; 国家高技术研究发展计划(863计划)中文核心期刊要目总览(PKU)中国科技核心期刊(ISTIC)中国科学引文数据库(CSCD)021-4,83
食品の安全・安心に対する消費者ニーズがたかまり, そのニーズに応えるためのコストが増大している。そのなかで, トレーサビリティシステム導入の責務は, 企業に業務の増加とコスト・アップというマイナス要因...
针对钢管生产企业的自动化信息化需求,设计了基于条码技术和PLC的钢管信息跟踪系统,包括条码喷印、条码识别、产品条码信息查询与管理三个模块,首次采用喷印条码的方式将条码技术应用于钢管制造业进行信息跟踪。...
作为自然语言处理一个新的研究方向,话题识别与跟踪旨在发展一系列基于事件的信息组织技术,以实现对新闻媒体信息流中新话题的自动识别以及对已知话题的动态跟踪.自1997年以来连续举行的多次大规模评测使得话题...
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内...
平成15年3月25日(火)-27日(木)情報処理学会第65回全国大会大学等の高等教育機関で体系的に行なわれている講義群の全データを収集,統合,分類できたなら ば,現在の学問体系の総合目録とよぶことがで...
福山最近在其有关政治秩序与政治衰败的著作中阐述的理论,表明福山并未放弃他早期的"历史终结"哲学,而恰恰是一种对人类历史将终结于自由民主的"终点"的回溯,甚至可说...
碩士商業教育學系[[abstract]]網路調查是利用網際網路的普及性及無時空限制性所進行的另一種調查資料取得的方式。網路調查的特點之一,是可對填答者給與即時的填答回應。網路調查有電腦郵件法、網路論壇...
Method for information system analysis in order to reveal possibilities of execution of data base re...
人工知能学会第1回セマンティックウェブとオントロジー研究会 : 2002年11月6日(火) : サイバーアシスト研究センターWeb で公開されたシラバスデータの収集と統合のための研究を行なっている。シ...
目的:开发并测试一套基于Web的剂量体积直方图(DVH)数据自动提取工具.方法:(1)采用Django应用框架和Python编程语言,设计一套基于Web的DVH数据自动提取工具.(2)利用自动工具分析...
细沟侵蚀在坡面水蚀中占有重要地位,用模型模拟预报细沟侵蚀具有重要意义。以往对细沟发育的研究主要停留在定性描述上,缺少对过程的定量分析。现有的基于物理过程基础上的侵蚀预报模型,如水蚀预报模型 WEPP...
2015年9月3日に成立した個人情報保護法改正では,① 個人情報保護委員会の新設に伴う権限の一元化,②個人情報の第三者提供に関するトレーサビリティの確保,③不正な利益を図る目的での個人情報データベース...
[[abstract]]近年來電腦資訊產業蓬勃發展,延伸出企業的電子商務、E化、M化等等,使得企業對電腦的依賴程度與日劇增。對於企業電腦管理人員而言,如何確保電腦運作正常與資訊安全,是一項重要的課題。...
景氣指數及指標常被用來監控景氣週期轉換的情形。普遍來說,這些指數及指標是由許多經濟變數所組成,而這些不同的變數都是由不同政府部門來彙整。為了整合這些變數,必須經由大量複雜程序處理,造成景氣周期監控的延...
互联网上的信息是社会状况的一种反映,可以被人们从多种不同的角度来关心.而有了计算机作为工具,这种"关心"的深度和广度就能够大大地拓展.提出一种模型,基于它实现的一套...
食品の安全・安心に対する消費者ニーズがたかまり, そのニーズに応えるためのコストが増大している。そのなかで, トレーサビリティシステム導入の責務は, 企業に業務の増加とコスト・アップというマイナス要因...
针对钢管生产企业的自动化信息化需求,设计了基于条码技术和PLC的钢管信息跟踪系统,包括条码喷印、条码识别、产品条码信息查询与管理三个模块,首次采用喷印条码的方式将条码技术应用于钢管制造业进行信息跟踪。...
作为自然语言处理一个新的研究方向,话题识别与跟踪旨在发展一系列基于事件的信息组织技术,以实现对新闻媒体信息流中新话题的自动识别以及对已知话题的动态跟踪.自1997年以来连续举行的多次大规模评测使得话题...
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内...
平成15年3月25日(火)-27日(木)情報処理学会第65回全国大会大学等の高等教育機関で体系的に行なわれている講義群の全データを収集,統合,分類できたなら ば,現在の学問体系の総合目録とよぶことがで...
福山最近在其有关政治秩序与政治衰败的著作中阐述的理论,表明福山并未放弃他早期的"历史终结"哲学,而恰恰是一种对人类历史将终结于自由民主的"终点"的回溯,甚至可说...
碩士商業教育學系[[abstract]]網路調查是利用網際網路的普及性及無時空限制性所進行的另一種調查資料取得的方式。網路調查的特點之一,是可對填答者給與即時的填答回應。網路調查有電腦郵件法、網路論壇...
Method for information system analysis in order to reveal possibilities of execution of data base re...
人工知能学会第1回セマンティックウェブとオントロジー研究会 : 2002年11月6日(火) : サイバーアシスト研究センターWeb で公開されたシラバスデータの収集と統合のための研究を行なっている。シ...
目的:开发并测试一套基于Web的剂量体积直方图(DVH)数据自动提取工具.方法:(1)采用Django应用框架和Python编程语言,设计一套基于Web的DVH数据自动提取工具.(2)利用自动工具分析...
细沟侵蚀在坡面水蚀中占有重要地位,用模型模拟预报细沟侵蚀具有重要意义。以往对细沟发育的研究主要停留在定性描述上,缺少对过程的定量分析。现有的基于物理过程基础上的侵蚀预报模型,如水蚀预报模型 WEPP...
2015年9月3日に成立した個人情報保護法改正では,① 個人情報保護委員会の新設に伴う権限の一元化,②個人情報の第三者提供に関するトレーサビリティの確保,③不正な利益を図る目的での個人情報データベース...
[[abstract]]近年來電腦資訊產業蓬勃發展,延伸出企業的電子商務、E化、M化等等,使得企業對電腦的依賴程度與日劇增。對於企業電腦管理人員而言,如何確保電腦運作正常與資訊安全,是一項重要的課題。...
景氣指數及指標常被用來監控景氣週期轉換的情形。普遍來說,這些指數及指標是由許多經濟變數所組成,而這些不同的變數都是由不同政府部門來彙整。為了整合這些變數,必須經由大量複雜程序處理,造成景氣周期監控的延...
互联网上的信息是社会状况的一种反映,可以被人们从多种不同的角度来关心.而有了计算机作为工具,这种"关心"的深度和广度就能够大大地拓展.提出一种模型,基于它实现的一套...
食品の安全・安心に対する消費者ニーズがたかまり, そのニーズに応えるためのコストが増大している。そのなかで, トレーサビリティシステム導入の責務は, 企業に業務の増加とコスト・アップというマイナス要因...
针对钢管生产企业的自动化信息化需求,设计了基于条码技术和PLC的钢管信息跟踪系统,包括条码喷印、条码识别、产品条码信息查询与管理三个模块,首次采用喷印条码的方式将条码技术应用于钢管制造业进行信息跟踪。...
作为自然语言处理一个新的研究方向,话题识别与跟踪旨在发展一系列基于事件的信息组织技术,以实现对新闻媒体信息流中新话题的自动识别以及对已知话题的动态跟踪.自1997年以来连续举行的多次大规模评测使得话题...