A Aprendizagem de Máquina pode ser aplicada em dados de muitos contextos diferentes e um deles é o da política. No Brasil, é comum termos muitos discursos a favor ou contra a aprovação de um novo projeto de lei ou emenda constitucional que repercute nas redes sociais e na mídia. Até que a decisão final seja tomada, muitos fatores são levados em consideração. Um projeto de lei pode ser uma proposta de vários tipos, apresentado por meio de diferentes iniciativas, pode percorrer diferentes caminhos, passar pelas mãos de diversas pessoas e, no geral, sofrer a influência de diversas situações durante todo seu processo de tramitação. Todo ele gera muitos dados que podem ser analisados de forma automatizada e eficaz gerando resultados interessantes.
O potencial de extração de informações e identificação de padrões usando IA, a disponibilidade de informações governamentais ao público garantida pela Lei de Acesso à Informação e os diversos fatores que podem influenciar a decisão de aprovação ou não de uma proposição foram motivações para que neste trabalho de conclusão de curso de Elcius Ferreira se aplicasse o método de Floresta Aleatória (do inglês Random Forest – RF) em proposições que tramitaram e ainda tramitam na Câmara dos Deputados.
Buscou-se, através de parâmetros da ferramenta, as proposições que tiveram sua definição (aprovação ou rejeição) entre os dias 01 de janeiro de 2011 e 31 de agosto de 2016, o que equivale ao período do governo Dilma. Da mesma forma, buscou-se as proposições que tiveram sua definição entre os dias 31 de agosto de 2016 e 16 de agosto de 2018, o que equivale a grande parte do governo Temer, que chegou ao fim em 31 de dezembro de 2018.
Ao usar os parâmetros de duração do governo Dilma na ferramenta de pesquisa, relatórios contendo 11039 IDs de proposições foram gerados, das quais 4,86% (537) foram aprovadas e 95,14% (10502) rejeitadas. Ao usar os parâmetros de duração do governo Temer, relatórios contendo 1274 IDs de proposições foram gerados, das quais 19,23% (245) foram aprovadas e 80,77% (1029) rejeitadas.
Nesta etapa, a primeira medida tomada foi em relação à transformação dos atributos categóricos (Tema, SiglasOrgaosTramitados, SiglaTipoProp, Indexação, DataApresentação, Autor, RegimeTramitação) – Primeiro Modelo. Após o processo de seleção de atributos, os que foram considerados para as etapas de treinamento e teste são: Ano, Número, QtdRelacionadas, QtdTramitacoes, SiglaTipoProp, Tema, Autor, DataApresentacao, RegimeTramitacao, Indexacao, SiglasOrgaosTramitados – Segundo Modelo.
Modelos preditivos foram construídos utilizando o algoritmo Floresta Aleatória e, os testes executados nos modelos treinados usando os dados do governo Dilma, alcançaram 98% de acerto na tentativa de prever a aprovação ou rejeição no Congresso Nacional. Os testes realizados nos modelos treinados usando os dados do governo Temer alcançaram 94% de acerto ao realizar o mesmo tipo de previsão. Posteriormente, os modelos realizaram a previsão do percentual de chance de aprovação de proposições consideradas prioritárias pelo governo Temer, sendo que das 12 totais, 4 já tiveram suas situações definidas e os modelos acertaram 3 destas.
Das 12 proposições, a PL 8456/2017, cuja previsão de aprovação pelo modelo Temer é de 62%, foi transformada na Lei Ordinária 13670/2018, as PLs 9327/2017 e 3453/2015 com 95% e 59% de chances de aprovação respectivamente, foram aprovadas na Câmara e seguiram para tramitação no Senado Federal. A definição final destas proposições por parte dos deputados da Câmara foram de acordo com o resultado dado pelo modelo, que indicou maior chance como sendo de aprovação.
A MPV 830/2018 foi rejeitada e se encontra arquivada pela Câmara dos Deputados, indo contra a probabilidade de 88% de chance de aprovação dada pelo modelo Temer. Fatores além das suas características básicas (que foram mapeadas como atributos) podem ter exercido influência no processo de tramitação comprometendo sua aprovação. Tais fatores podem ser, por exemplo, articulações políticas, pressão da mídia/população e outros.
Todas as outras propostas da tabela seguem em tramitação.