Contenido eliminado Contenido añadido
Línea 160:
He intentado usar wikisourcetext.py pero no consigo hacerlo funcionar, siempre me da error en el parámetro index, por ejemplo <code>python3 pwb.py wikisourcetext -index:"Julio_César_(1921).djvu" -pages:73-80 -ocr:googleOCR</code>, que estaré haciendo mal? [[Usuario:Shooke|Shooke]] ([[Usuario discusión:Shooke|discusión]]) 18:17 3 jul 2020 (UTC)
:Simplemente hay que agregarle a -index:"'''Index:'''blablabla..." Lo probé con el resto de tu código y me funcionó. No conocía bien este bot, yo lo bueno es que le agrega el encabezado por defecto! Genial. --[[Usuario:Ninovolador|Ninovolador]] ([[Usuario discusión:Ninovolador|discusión]]) 20:43 3 jul 2020 (UTC)
:Si probeprobé conecon eso tambientambién, pero no me funcionó, debe haber algo mal en mi instalación de pywikibot. Estoy empezando a usar el bot para corregir las transcripciones, automatizar reemplazos, me sirvió mucho la experiencia de reemplazar tag center obsoleto, se puede dar una pasada o varias pasadas para corregir, y asi alivianar la corrección final de las transcripciones. Estoy pensando en hacer un script especial para eso y usar otras librerías de python. Saludos [[Usuario:Shooke|Shooke]] ([[Usuario discusión:Shooke|discusión]]) 21:25 3 jul 2020 (UTC)
::La idea es un script que reconozca por ocr, y se pongan directivas de reemplazo, y se genere automaticamente por tandas, un texto que tenga las minimas correcciones por realizar, por ejemplo [https://es.wikisource.org/w/index.php?title=P%C3%A1gina:Julio_C%C3%A9sar_(1921).djvu/73&curid=263883&diff=1108395&oldid=1108384 aquí] aprovecho que los nombres del encabezado de los personajes está en mayúscula y entre dos <code>\n<code/> y ahi es donde reemplazo con el otro script. Y el texto resulta bastante aceptable. [[Usuario:Shooke|Shooke]] ([[Usuario discusión:Shooke|discusión]]) 21:40 3 jul 2020 (UTC)