ویکی‌پدیا:درخواست‌های ربات/ربات مقالات دارای تگ‌های الگو

<syntaxhighlight lang='python'>

  1. -*- coding: utf-8 -*-
  2. http://dumps.wikimedia.your.org/fawiki/
  3. http://dumps.wikimedia.your.org/fawiki/20150325/fawiki-20150325-pages-meta-current.xml.bz2

import wikipedia, xmlreader, codecs, re import os bot_adress="/data/project/Yourbot/" TheDay='20150325'

urllinkmain='http://dumps.wikimedia.your.org/fawiki/%s/fawiki-%s-pages-meta-current.xml.bz2' %(TheDay,TheDay) print urllinkmain os.system('wget '+urllinkmain +" "+bot_adress+"fawiki-"+TheDay+"-pages-meta-current.xml.bz2") dump = xmlreader.XmlDump(bot_adress+"fawiki-"+TheDay+"-pages-meta-current.xml.bz2")

pre,noinclude,includeonly,tags1,tags2=u'\n',u'\n',u'\n',u'\n',u'\n' for entry in dump.new_parse():

   if entry.ns =='0':
       text=entry.text.replace(u' /',u'/').replace(u'/ ',u'/').replace(u'< ',u'<').replace(u' >',u'>')
       if u in text or u in text:
           noinclude+=u"#%s\n" % entry.title
       elif u in text:
           includeonly+=u"#%s\n" % entry.title

elif u'

' in text or u'

' in text:

           pre+=u"#%s\n" % entry.title
       elif u in text:
           tags1+=u"#%s\n" % entry.title
       elif u in text:
           tags2+=u"#%s\n" % entry.title
       else:
           continue
       wikipedia.output(entry.title)

my_text=u'\n== pre ==\n'+pre+u'\n== noinclude ==\n'+noinclude+u'\n== includeonly ==\n'+includeonly+u'\n== NOGALLERY ==\n'+tags1+u'\n== NOEDITSECTION ==\n'+tags2

  1. f=codecs.open(bot_adress+"zztages.txt","w","utf-8")
  2. f.write(my_text)
  3. f.close()
  4. os.system("rm "+bot_adress+"fawiki-%s-pages-meta-current.xml.bz2" %(TheDay))

site = wikipedia.getSite('fa') page = wikipedia.Page(site,u"ویکی‌پدیا:گزارش دیتابیس/مقالاتی که تگ الگو دارند") my_text=u'مقالات زیر ممکن است الگو درون آنها به اشتباه استفاده شده‌باشد \n'+my_text page.put(my_text,u"ربات: به‌روز رسانی آمار دیگر ویکی‌ها")