#!/usr/local/bin/ruby #hatena_counter.rb require 'open-uri' require "pp" require 'uri' urls = ["https://anond.hatelabo.jp/archive/200609"] =begin urls = ["https://anond.hatelabo.jp/archive/200609", "https://anond.hatelabo.jp/archive/200610", "https://anond.hatelabo.jp/archive/200611", "https://anond.hatelabo.jp/archive/200612", "https://anond.hatelabo.jp/archive/200701", "https://anond.hatelabo.jp/archive/200702", "https://anond.hatelabo.jp/archive/200703", "https://anond.hatelabo.jp/archive/200704", "https://anond.hatelabo.jp/archive/200705", "https://anond.hatelabo.jp/archive/200706", "https://anond.hatelabo.jp/archive/200707", "https://anond.hatelabo.jp/archive/200708", "https://anond.hatelabo.jp/archive/200709", "https://anond.hatelabo.jp/archive/200710", "https://anond.hatelabo.jp/archive/200711", "https://anond.hatelabo.jp/archive/200712", "https://anond.hatelabo.jp/archive/200801", "https://anond.hatelabo.jp/archive/200802", "https://anond.hatelabo.jp/archive/200803", "https://anond.hatelabo.jp/archive/200804", "https://anond.hatelabo.jp/archive/200805", "https://anond.hatelabo.jp/archive/200806", "https://anond.hatelabo.jp/archive/200807", "https://anond.hatelabo.jp/archive/200808", "https://anond.hatelabo.jp/archive/200809", "https://anond.hatelabo.jp/archive/200810", "https://anond.hatelabo.jp/archive/200811", "https://anond.hatelabo.jp/archive/200812", "https://anond.hatelabo.jp/archive/200901", "https://anond.hatelabo.jp/archive/200902", "https://anond.hatelabo.jp/archive/200903", "https://anond.hatelabo.jp/archive/200904", "https://anond.hatelabo.jp/archive/200905", "https://anond.hatelabo.jp/archive/200906", "https://anond.hatelabo.jp/archive/200907", "https://anond.hatelabo.jp/archive/200908", "https://anond.hatelabo.jp/archive/200909", "https://anond.hatelabo.jp/archive/200910", "https://anond.hatelabo.jp/archive/200911", "https://anond.hatelabo.jp/archive/200912", "https://anond.hatelabo.jp/archive/201001", "https://anond.hatelabo.jp/archive/201002", "https://anond.hatelabo.jp/archive/201003", "https://anond.hatelabo.jp/archive/201004", "https://anond.hatelabo.jp/archive/201005", "https://anond.hatelabo.jp/archive/201006", "https://anond.hatelabo.jp/archive/201007", "https://anond.hatelabo.jp/archive/201008", "https://anond.hatelabo.jp/archive/201009", "https://anond.hatelabo.jp/archive/201010", "https://anond.hatelabo.jp/archive/201011", "https://anond.hatelabo.jp/archive/201012", "https://anond.hatelabo.jp/archive/201101", "https://anond.hatelabo.jp/archive/201102", "https://anond.hatelabo.jp/archive/201103", "https://anond.hatelabo.jp/archive/201104", "https://anond.hatelabo.jp/archive/201105", "https://anond.hatelabo.jp/archive/201106", "https://anond.hatelabo.jp/archive/201107", "https://anond.hatelabo.jp/archive/201108", "https://anond.hatelabo.jp/archive/201109", "https://anond.hatelabo.jp/archive/201110", "https://anond.hatelabo.jp/archive/201111", "https://anond.hatelabo.jp/archive/201112", "https://anond.hatelabo.jp/archive/201201", "https://anond.hatelabo.jp/archive/201202", "https://anond.hatelabo.jp/archive/201203", "https://anond.hatelabo.jp/archive/201204", "https://anond.hatelabo.jp/archive/201205", "https://anond.hatelabo.jp/archive/201206", "https://anond.hatelabo.jp/archive/201207", "https://anond.hatelabo.jp/archive/201208", "https://anond.hatelabo.jp/archive/201209", "https://anond.hatelabo.jp/archive/201210", "https://anond.hatelabo.jp/archive/201211", "https://anond.hatelabo.jp/archive/201212", "https://anond.hatelabo.jp/archive/201301", "https://anond.hatelabo.jp/archive/201302", "https://anond.hatelabo.jp/archive/201303", "https://anond.hatelabo.jp/archive/201304", "https://anond.hatelabo.jp/archive/201305", "https://anond.hatelabo.jp/archive/201306", "https://anond.hatelabo.jp/archive/201307", "https://anond.hatelabo.jp/archive/201308", "https://anond.hatelabo.jp/archive/201309", "https://anond.hatelabo.jp/archive/201310", "https://anond.hatelabo.jp/archive/201311", "https://anond.hatelabo.jp/archive/201312", "https://anond.hatelabo.jp/archive/201401", "https://anond.hatelabo.jp/archive/201402", "https://anond.hatelabo.jp/archive/201403", "https://anond.hatelabo.jp/archive/201404", "https://anond.hatelabo.jp/archive/201405", "https://anond.hatelabo.jp/archive/201406", "https://anond.hatelabo.jp/archive/201407", "https://anond.hatelabo.jp/archive/201408", "https://anond.hatelabo.jp/archive/201409", "https://anond.hatelabo.jp/archive/201410", "https://anond.hatelabo.jp/archive/201411", "https://anond.hatelabo.jp/archive/201412", "https://anond.hatelabo.jp/archive/201501", "https://anond.hatelabo.jp/archive/201502", "https://anond.hatelabo.jp/archive/201503", "https://anond.hatelabo.jp/archive/201504", "https://anond.hatelabo.jp/archive/201505", "https://anond.hatelabo.jp/archive/201506", "https://anond.hatelabo.jp/archive/201507", "https://anond.hatelabo.jp/archive/201508", "https://anond.hatelabo.jp/archive/201509", "https://anond.hatelabo.jp/archive/201510", "https://anond.hatelabo.jp/archive/201511", "https://anond.hatelabo.jp/archive/201512", "https://anond.hatelabo.jp/archive/201601", "https://anond.hatelabo.jp/archive/201602", "https://anond.hatelabo.jp/archive/201603", "https://anond.hatelabo.jp/archive/201604", "https://anond.hatelabo.jp/archive/201605", "https://anond.hatelabo.jp/archive/201606", "https://anond.hatelabo.jp/archive/201607", "https://anond.hatelabo.jp/archive/201608", "https://anond.hatelabo.jp/archive/201609", "https://anond.hatelabo.jp/archive/201610", "https://anond.hatelabo.jp/archive/201611", "https://anond.hatelabo.jp/archive/201612", "https://anond.hatelabo.jp/archive/201701", "https://anond.hatelabo.jp/archive/201702", "https://anond.hatelabo.jp/archive/201703", "https://anond.hatelabo.jp/archive/201704", "https://anond.hatelabo.jp/archive/201705", "https://anond.hatelabo.jp/archive/201706", "https://anond.hatelabo.jp/archive/201707", "https://anond.hatelabo.jp/archive/201708"] =end #url = 'http://mukar.com/test.cgi?cont=日本語テスト ホゲホゲ' #url_escape = URI.escape(url) #puts url_escape #=> http://mukar.com/test.cgi?cont=%E6%97%A5%E6%9C%AC%E8%AA%9E%E3%83%86%E3%82%B9%E3%83%88%20%E3%83%9B%E3%82%B2%E3%83%9B%E3%82%B2 #puts URI.unescape(url_escape) #=>http://mukar.com/test.cgi?cont=日本語テスト ホゲホゲ # # ↑こいつ最高にアホ! はわわわ アイコンをアバターとしたチャット。ともだちられシステムは.. =begin text = <<"EOS" 2006年09月の人気記事 - はてな匿名ダイアリー
ようこそ ゲスト さん
EOS =end =begin target_date = [] urls = ["https://anond.hatelabo.jp/archive/200609"] urls.each do |url| OpenURI.open_uri(url).each_line do |html| new_line_has_been_html = html.gsub(/
  • /, "\n
  • ") new_line_has_been_html.each_line do |line| if line =~ %r|
  • .+| target_date << line.slice(%r|
  • .+|, 1) end end end end =end archive_page_htmls = [] urls.each do |url| OpenURI.open_uri(url).each_line do |html| archive_page_htmls << html end end target_date = [] target_title = [] archive_page_htmls.each do |text| #エントリーの日付を取得 text.each_line do |html| html.gsub(/
  • /, "\n
  • ").each_line do |line| target_date << line.slice(%r|href="(/2\d+)">(.+).+/, "\n
  • ").each_line do |line| target_title << line.slice(%r|href="(/2\d+)">(.+) .+ (.+) |, 2) if line =~ %r|href="/2\d+">.+ | #エントリーが2種類に別れる。仕様の詳細は不明 end end end =begin target_date_and_title = [] #エントリーの日付とタイトルを取得 text.each_line do |html| html.gsub(/
  • /, "\n
  • ").each_line do |line| date = line.slice(%r|href="(/2\d+)">(.+).+(.+) .+ (.+) |, 2) if line =~ %r|href="/2\d+">.+ | #エントリーが2種類に別れる。仕様の詳細は不明 target_date_and_title << [date, title] end end =end #target_pairs.each do |d| # puts URI.unescape(d) #end #エントリーの日付とタイトルを合成 target_date_and_title = [target_date, target_title].transpose #array.each_slice(2).to_a target_date_and_title.each do |d| puts d unless d[0] == nil end #pp target_date_and_title