Web页面所表达的主要信息通常隐藏在大量无关的结构和文字中,使用户不能迅速获取主题信息,限制了Web的可用性,信息提取有助于解决这一问题.基于DOM规范,针对HTML的半结构化特征和缺乏语义描述的不足,提出含有语义信息的STU-DOM树模型.将HTML文档转换为STU-DOM树,并对其进行基于结构的过滤和基于语义的剪枝,能够准确地提取出主题信息.方法不依赖于信息源,而且不改变源网页的结构和内容,是一种自动、可靠和通用的方法.具有可观的应用价值,可应用于PAD和手机上的Web浏览以及信息检索系统.国家重点基础研究发展计划(973计划); 国家高技术研究发展计划(863计划)中文核心期刊要目总览(PKU)中国科学引文数据库(CSCD)0101786-17924
インターネットが普及した現在では紙媒体の新聞だけではなく、Web によって新聞記事を読むことも一般的になってきている。Web の新聞記事はアクセスランキングが発表されている場合もある。アクセスランキン...
利用は著作権の範囲内に限られますブラウザに表示される入力フォームにおいて、属性ごとにキーワードを指定して検索が可能な Web データベースが増えている。さらに、このようなサービスをアプリケーションから...
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内...
互联网上的信息是社会状况的一种反映,可以被人们从多种不同的角度来关心.而有了计算机作为工具,这种"关心"的深度和广度就能够大大地拓展.提出一种模型,基于它实现的一套...
Web is a vast resource of information, but its representation limits its availability: the main info...
Web用户评论是许多重要应用的信息来源,比如公众舆情的检测与分析,Web用户评论必须从网页中准确地抽取出来.用户生成内容(user-generated content)不受页面模板的限制,这就给Web...
[[abstract]]本研究旨在WWW平台上建構一個適合小学四年級學童從事主題式學習之學習日誌機制,以支援學生的學習與教師的評量。學生在這個主題式學習模式下,透過科學寫作以網頁來撰寫其學習日誌,內容...
[[abstract]]本研究之目的在於建構一個適合小学主題式學習之線上測驗系統。本系統是根據Bloom 的精熟理論為基礎而發展的,提供小学學童在限期內多次練習的服務,並給予立即的回饋,讓學童有機會練...
[[abstract]]本文旨在分享研究者近年來在 web-based 專題式學習之教學與多元化評量方面的研究成果,並說明其相關的理論與實務。研究者首先進行有關web-based 專題式學習的教學及多...
ブラウザに表示される入力フォームにおいて, 属性ごとにキーワードを指定して検索が可能なWebデータベースが増えている.さらに, このようなサービスをアプリケーションから直接利用する枠組としてWebサー...
提出一种统一的Web新闻对象自动抽取方法.通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自...
複数のWeb サイトを定期的かつ詳細に分析する場合,サイトが持つ多量のWeb ページをどう閲覧するかが問題になる.多量のWeb ページを表示方法として,流れるように連続的に事柄を表す伝統的な巻物の表示...
卒業論文text情報視覚化(Information Visualization)という研究においてWWW(World Wide Web)の視覚化という分野がある、これはWWWのリンク構造をグラフ化して...
[[abstract]]隨著網路技術的提升與演進,網路逐漸演化成一個強調使用者共同參與、分享及創造網路內容的平台。而強調此觀念的Web 2.0已成為現代網路中不可或缺的名詞之一。 本專題蒐集許多We...
The main information of a webpage is usually mixed between menus, advertisements, panels, and other...
インターネットが普及した現在では紙媒体の新聞だけではなく、Web によって新聞記事を読むことも一般的になってきている。Web の新聞記事はアクセスランキングが発表されている場合もある。アクセスランキン...
利用は著作権の範囲内に限られますブラウザに表示される入力フォームにおいて、属性ごとにキーワードを指定して検索が可能な Web データベースが増えている。さらに、このようなサービスをアプリケーションから...
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内...
互联网上的信息是社会状况的一种反映,可以被人们从多种不同的角度来关心.而有了计算机作为工具,这种"关心"的深度和广度就能够大大地拓展.提出一种模型,基于它实现的一套...
Web is a vast resource of information, but its representation limits its availability: the main info...
Web用户评论是许多重要应用的信息来源,比如公众舆情的检测与分析,Web用户评论必须从网页中准确地抽取出来.用户生成内容(user-generated content)不受页面模板的限制,这就给Web...
[[abstract]]本研究旨在WWW平台上建構一個適合小学四年級學童從事主題式學習之學習日誌機制,以支援學生的學習與教師的評量。學生在這個主題式學習模式下,透過科學寫作以網頁來撰寫其學習日誌,內容...
[[abstract]]本研究之目的在於建構一個適合小学主題式學習之線上測驗系統。本系統是根據Bloom 的精熟理論為基礎而發展的,提供小学學童在限期內多次練習的服務,並給予立即的回饋,讓學童有機會練...
[[abstract]]本文旨在分享研究者近年來在 web-based 專題式學習之教學與多元化評量方面的研究成果,並說明其相關的理論與實務。研究者首先進行有關web-based 專題式學習的教學及多...
ブラウザに表示される入力フォームにおいて, 属性ごとにキーワードを指定して検索が可能なWebデータベースが増えている.さらに, このようなサービスをアプリケーションから直接利用する枠組としてWebサー...
提出一种统一的Web新闻对象自动抽取方法.通过抽取新闻页面中的分类、标题、发布时间、来源、作者、内容、相关评论链接和相关新闻链接作为分类属性,经页面解析、候选值抽取、真值识别3个步骤,实现新闻对象的自...
複数のWeb サイトを定期的かつ詳細に分析する場合,サイトが持つ多量のWeb ページをどう閲覧するかが問題になる.多量のWeb ページを表示方法として,流れるように連続的に事柄を表す伝統的な巻物の表示...
卒業論文text情報視覚化(Information Visualization)という研究においてWWW(World Wide Web)の視覚化という分野がある、これはWWWのリンク構造をグラフ化して...
[[abstract]]隨著網路技術的提升與演進,網路逐漸演化成一個強調使用者共同參與、分享及創造網路內容的平台。而強調此觀念的Web 2.0已成為現代網路中不可或缺的名詞之一。 本專題蒐集許多We...
The main information of a webpage is usually mixed between menus, advertisements, panels, and other...
インターネットが普及した現在では紙媒体の新聞だけではなく、Web によって新聞記事を読むことも一般的になってきている。Web の新聞記事はアクセスランキングが発表されている場合もある。アクセスランキン...
利用は著作権の範囲内に限られますブラウザに表示される入力フォームにおいて、属性ごとにキーワードを指定して検索が可能な Web データベースが増えている。さらに、このようなサービスをアプリケーションから...
互联网的快速发展已经使得网页数据成为目前各种应用与研究的重要数据源之一.网页数据包含各种内容,如广告、导航条、相关链接、正文等,然而对于不同的研究和应用来说,并非所有内容都是必需的,相反地,不相关的内...