碩士[[abstract]]現今網際網路上所存在的資料量越來越大、越來越豐富,並且以非常快的速度持續成長。使用者常常需要在各個主要內容來源網站搜集新資訊,更有不少人是幾乎每天會固定瀏覽一些特定的網頁,查看持續更新的內容。使用上的需求逼迫人們必須要在各個內容來源網站之間跳躍,只是為了查看是否存在自己感興趣的資料。這樣高頻率的在不同頁面間跳轉瀏覽,提高了資訊蒐集的成本,如何讓資訊的取得更方便快速,是一個重要的課題。 自動擷取網頁內容的方法大致分為兩個方向,傳統的方法是針對目標網站寫一個擷取程式,透過人工觀察網頁原始碼的方式,設計出內容擷取的流程。而這樣的作法除了需要具有程式撰寫能力外,如果擷取目標網站不只一個,就需要針對每一個網站撰寫各自獨立的擷取流程。另一類方法是透過預先定義的判斷方式,去自動判定不同網頁中的資料所在位置,再加以擷取下來。但頁面中到底哪些資料對使用者來說是感興趣的,非常難給予一個精確定義,導致系統在資料區域的定義上很難有一個通用的解釋。在本篇論文中提出VBDE (Visual Block-based Data Extraction) 網頁區塊擷取演算法,並結合視覺化操作介面,實作一個視覺化的資料擷取系統。使用者不需要具備相關背景知識,就能在一個直覺的操作環境下指定網頁中想要擷取的特定區塊。在不同的網頁間,有效的適應並正確擷取資料。[[abstract]]With the explosive growth of web pages available on the Internet, network has become a major source of information for a large number of users. Those users w...