Hola, saludos a todos. Les tengo una pequeña consulta, y estoy seguro que sus comentarios podrían ayudarme; estoy comenzando un proyecto, es un espacio para poner artículos tanto para promocionar empresas cómo para hacer seo, y me estoy trabajando un codigo para detectar contenido copiado de otros sitios web, para evitar que publiquen ese contenido en mi web.
Mi pregunta es entorno a su experiencia en cuanto al mismo, cuanto creen que sea recomendable tener en cuenta permitir.
Supongamos, tengo un texto de 4 parrafos, hay "comas" y "puntos" y "puntos y comas" "y los tag html "<p>" y "<br>" separando lo que podía suponerse oraciones o fragmentos de textos.
Si por ejemplo, los 4 parrafos se dividen en 10 fragmentos, ¿cuantos creen que sea debido aceptar que sean duplicados, llevandolo a porcentaje y si se puede, porqué razón piensan así?.
Yo pienso, que hay personas que toman frases de ciertas páginas y quizás se trabajen un texto bien diseñado, pero se tomen unos párrafos de otras páginas, o utilicen varios fragmentos para armar un texto. Que porcentaje estiman correcto permitir, porque quizás denegar en su totalidad sería un error, pues también pueden haber pequeñas oraciones que tiendan a coincidir sin necesidad de haber sido copiadas. Espero sus sugerencias
Saludos