b217. 2. 線串式主題閱讀系統
標籤 :
通過比率 : 60人/80人 ( 75% ) [非即時]
評分方式:
Tolerant

最近更新 : 2012-07-23 13:47

內容

因為網路論壇的流行,吸引大量的內容討論文章。但傳統的閱讀方式是條列式、依照時間出現順序排列,一旦討論數量龐大,很難找到集中的討論主題。線串主題 (subject threading)就是一種將相同主題 (subject)集中,以方便閱讀的瀏覽方式。我們希望設計線串主題排列系統,挑選集中相同的主題文章,再依照最早出現主題的時間,依序排列。為了簡化系統,我們將文章的主題與發表時間摘要出來,成為一個集中的索引檔案,請根據此索引檔,輸出線串主題。

文章索引檔表示法說明:
索引檔內為每一篇文章建立三個欄位,分別為主題(Subject)、日期(Date)、與識別碼(ID)。主題表示為:
Subject: xxxxx
其中“Subject:’’ 之後有一空白,“xxxxx” 為主題內容。主題內容可含除換行之外的任何字元。主題內容前三個字元若為 “Re:”或“RE:”則忽略不計。若內容有多組“Re:”或“RE:”刪除第一組即可,內容字串第一個非空白字元前之任何數量的空白(0x20)皆忽略不計;而主題字串最後一個非空白字元之後的所有空白字元也忽略不計,除此之外,比較兩主題是否相同時,所有字元必須完全相同,例如以下前三個主題皆視為相同主題,但最後一個則視為不同的主題:
Subject: 有關高中程式競賽
Subject: Re: 有關高中程式競賽
Subject: Re:有關高中程式競賽
Subject: Re: Re: 有關高中程式競賽

日期欄位表示如右: M D H Y
其中,M 為 1 至 12 的整數,分別代表 1 月到 12 月。D 為 1 到 31 的整數,表示當月份第 1 日至 31 日。H 表示時,為 0 到 23 的整數。Y 代表年,為四位整數。數字間以一個空白相隔。例如以下日期表示 2008 年 11 月 3 日 12 時:
Date: 11 3 12 2008
“Date:’’ 之後有一空白。
識別碼則以最多十位整數表示 每一篇文章之識別碼在索引檔中都是唯一 例如,。:
ID: 1234567
“ID:’’ 之後有一空白。

輸入說明
輸入為文章索引檔 每一篇文章有三個欄位,每一欄位單獨一行,依序為 Subject:Date: 與 ID:。 Subject: 欄位長度最多 1024 個字元(byte),不同的文章索引欄位以一空白行間隔。連續兩個空白行表示資料結束。每個索引檔最多含有 10,000 篇文章索引(每篇文章三個欄位),至少有兩個線串。
輸出說明
輸出主題(已濾除 Re: RE: 與空白字元)相同的文章索引欄位為一主題線串,以線串中時間最早的文章為基準,依據時間先後次序輸出主題,倘若時間相同,則以在索引檔中出現的順序輸出。再將此線串中的文章依據出現時間輸出其對應ID,若時間相同,以在索引檔中出現的順序排列,並以逗點隔開。線串之間以一空白行隔開。連續兩空白行表示結束,請輸出最早出現的 2 個線串資料即可,例如:
Subject: 有關高中程式競賽
ID: 1234657,123456,98765
Subject: 高中程式競賽地點
ID: 8888,9999,1000
範例輸入 #1
輸入範例 1:
Subject: 經濟風暴
Date: 11 20 10 2008
ID: 1

Subject: 美國總統當選人
Date: 11 19 12 2008
ID: 12

Subject: Re: 經濟風暴
Date: 11 21 20 2008
ID: 34

Subject: Re: 美國總統當選人
Date: 11 22 13 2008
ID: 98

輸入範例 2:
Subject: 失業率升高
Date: 11 28 10 2008
ID: 1

Subject: 美國總統當選人
Date: 11 19 12 2008
ID: 12

Subject: 經濟風暴
Date: 11 21 20 2008
ID: 34

Subject: Re: 美國總統當選人
Date: 11 22 13 2008
ID: 98
範例輸出 #1
輸出範例 1:(只需輸出最早出現的 2 個線串)
Subject: 美國總統當選人
ID: 12,98
Subject: 經濟風暴
ID: 1,34

輸出範例 2:(只需輸出最早出現的 2 個線串)
Subject: 美國總統當選人
ID: 12,98

Subject: 經濟風暴
ID: 34

測資資訊:
記憶體限制: 512 MB
公開 測資點#0 (20%): 2.0s , <1K
公開 測資點#1 (20%): 2.0s , <1M
公開 測資點#2 (20%): 2.0s , <1M
公開 測資點#3 (20%): 2.0s , <1M
公開 測資點#4 (20%): 2.0s , <10M
提示 :
標籤:
出處:
97學年度全國資訊學科能力競賽

本題狀況 本題討論 排行

編號 身分 題目 主題 人氣 發表日期
沒有發現任何「解題報告」