Concepts on Natural Language Processing

#vts #learning #networks #WIE
Share

Resumo do curso

Este curso tem como objetivo introduzir conceitos fundamentais e aplicação de Processamento de Linguagem Natural (NLP). Os tópicos incluem tokenização, análise sintática (parsing), reconhecimento de entidades nomeadas (NER) e classificação de textos, com foco em aplicações práticas. Além das aulas teóricas, os participantes realizarão práticas baseadas em projetos, com potencial de desenvolvimento de artigos científicos.

 



  Date and Time

  Location

  Hosts

  Registration



  • Start time: 10 Mar 2025 11:30 AM UTC
  • End time: 14 Mar 2025 04:30 PM UTC
  • Add_To_Calendar_icon Add Event to Calendar
If you are not a robot, please complete the ReCAPTCHA to display virtual attendance info.
  • Universidade de Brasília - UnB
  • Brasília, Distrito Federal
  • Brazil 70.910-900
  • Building: Prédio da Faculdade de Tecnologia
  • Room Number: Bloco E
  • Click here for Map

  • Contact Event Host
  • Programa de Pós-Graduação Profissional em Engenharia Elétrica da Universidade de Brasília

  • Co-sponsored by Programa de Pós-Graduação Profissional em Engenharia Elétrica da Universidade de Brasília
  • Starts 05 March 2025 03:00 AM UTC
  • Ends 08 March 2025 02:59 AM UTC
  • No Admission Charge


  Speakers

Prof. Dra- Elena Javidi da Costa of University of Brasília

Topic:

Concepts on Natural Language Processing

Biography:

Possui doutorado em engenharia mecatrônica com ênfase em sistemas inteligentes (2024), mestrado em engenharia biomédica pela Technische Universität Ilmenau (2019) e graduação em engenharia biomédica pela Islamic Azad University (2011). Atualmente é líder de projeto na Universität Kassel. Tem experiência na indústria automativa como engenheira de testes em projeto da BMW. 

Email:

Prof. Dr. João Paulo Javidi da Costa of Hamm Lippstadt University of Applied Sciences

Topic:

Concepts on Natural Language Processing

Biography:

João Paulo Javidi da Costa é professor de engenharia elétrica da Universidade de Ciências Aplicadas Hamm-Lippstadt (HSHL) na Alemanha e é membro do Programa de Pós-Graduação de North Rhine-Westphala (PK NRW).Sua formação inclui engenharia eletrônica pelo Instituto Militar de Engenharia (IME) em 2003, mestre em engenharia elétrica pela Universidade de Brasília (UnB) em 2006 e doutor em engenharia elétrica pela Universidade Técnica de Ilmenau (TUIL) na Alemanha em 2010. De 2010 a 2019, atuou como professor do Departamento de Engenharia Elétrica da Universidade de Brasília (UnB). De 2016 a 2017, foi pesquisador visitante no Instituto Fraunhofer. De 2019 a 2020, atuou como engenheiro de desenvolvimento sênior de uma subsidiária da Audi na Alemanha na área de veículos autônomos. Ainda entre 2019 e 2020, foi professor do curso de veículos autônomos da Universidade Técnica de Ciências Aplicadas (THI) em Ingolstadt. Atualmente ele coordena o projeto Beyond 5G Virtual Environment for Cybersecurity Testing in V2X systems (B5GCyberTestV2X) financiado pelo Federal Office for Information Security (BSI), atua como professor visitante de curta duração na UnB financiado pelo DAAD e como editor associado do periódico IEEE Sensors. É membro do comitê de área técnica de processamento de sinais para sistemas multisensores da European Association for Signal Processing (EURASIP). Suas áreas de interesse são veículos autônomos, comunicação sem fio, processamento de sinais e segurança cibernética.

Email:


José Alberto Sousa Torres of University of Brasília

Topic:

Entity Matching and Record Linkage: Core Techniques for NLP Applications

In this talk, we will explore the fundamental techniques for Entity Matching (EM) and Record Linkage (RL), crucial for natural language processing (NLP) applications that integrate and analyze data from multiple sources. We will cover the key challenges in entity resolution, including handling noisy, incomplete, and ambiguous data. The session will introduce approaches to EM and RL, discussing their strengths and limitations. Practical case studies will demonstrate how these methods are applied in real-world scenarios. By the end, attendees will have a solid understanding of the core methodologies and best practices to improve entity resolution in NLP-driven systems.

Biography:

José Alberto Sousa Torres was born in Salvador, Bahia, Brazil, in 1982. He received his Bachelor's degree in IT Systems Analysis in 2005 from the State University of Bahia. At the University of Salvador, he obtained his M.Sc. in Systems and Computing in 2012. He is currently a doctoral student in Electrical Engineering at the University of Brasília. His research interests include signal processing, data science, and theoretical and practical applications of machine learning and natural language processing.

Email:

Dário P. Dos Santos of University of Brasília

Topic:

Large Language Models for Text Classification: A New Era of Accuracy and Efficiency

This study evaluates the effectiveness of large language models (LLMs) in text classification tasks, comparing their performance with earlier models like BART and RoBERTa. We conducted an empirical analysis of various models, including BERT-base-unicase, RoBERTa-base, Mistal-nemo, and Llama3, using metrics such as precision, recall, and F1-score in categories like Business, Entertainment, Politics, Sport, and Tech. Our findings show that Llama3 outperforms other models, achieving an average precision and F1-score of 0.91%, excelling in Sport and Tech with precision scores of 0.97%. These results position Llama3 as a leading choice for text classification tasks.

Biography:

Dário P. Dos Santos is a researcher at the Laboratório de Tecnologias da Tomada de Decisão (LATITUDE.UnB) at the University of Brasília (UnB). His research focuses on Natural Language Processing (NLP), machine learning, and deep learning applications. He has contributed to multiple studies in text classification, information retrieval, and large language models.

 

Email:


Dr. Kevin Herman Muraro Gularte of Hamm Lippstadt University of Applied Sciences

Topic:

Advancements in AI based Detection of Cases of Modern Slavery in Supply Chains: A Systematic Literature Review

This paper presents a comprehensive hybrid review that integrates a Systematic Literature Review (SLR) with a thematic survey to advance the understanding and application of Artificial Intelligence (AI) in detecting modern slavery within supply chains. The SLR component systematically maps and categorizes many peer-reviewed publications, addressing research questions focusing on AI methodologies employed to identify forced labor and modern slavery. Complementing the SLR, a thematic survey synthesizes insights from additional studies spanning both domain-specific investigations on modern slavery in supply chains and broader AI applications in related contexts. The integrated analysis reveals significant methodological innovations and critical challenges, such as data accessibility, algorithmic fairness, and scalability issues, that must be addressed to enhance the effectiveness of AI-driven solutions. Furthermore, the review outlines actionable future research directions and policy implications aimed at promoting ethical, transparent, and sustainable practices in supply chain management.

Biography:

KEVIN HERMAN MURARO GULARTE received the B.Sc. degree in Mechatronics Engineering from the University of Brasília (UnB) in 2013, the M.Sc. degree in Mechatronic Systems from UnB in 2018, and the Dr.Sc. degree in Electronic Systems and Automation from UnB in 2021. He worked as a postdoctoral researcher at the Graduate Program in Mechatronic Systems (PPMEC) at UnB from 2022 to 2024, focusing on nonlinear control, chaotic synchronization, and cybersecurity for V2X communications. In 2024, he joined the Hamm-Lippstadt University of Applied Sciences (HSHL) as a Research Assistant, contributing to the Beyond 5G Virtual Environment for Cybersecurity Testing in V2X Systems (B5GCyberTestV2X) project. His research interests include synchronization of chaotic and hyperchaotic systems, adaptive control, neural networks, Lyapunov stability theory, system identification, secure communication schemes, and cybersecurity for autonomous vehicles.

Email:

Luis Felipe Oliveira de Melo of Hamm Lippstadt University of Applied Sciences

Topic:

Redes Neurais Convolucionais e Suas Aplicações

Redes Neurais Convolucionais (CNNs) são uma classe de modelos de aprendizado profundo amplamente utilizados para processamento de dados com estrutura sequencial ou em grade, como imagens, vídeos, textos, séries temporais, etc. Inspiradas na organização do córtex visual biológico, as CNNs empregam camadas convolucionais para extrair características hierárquicas e espacialmente invariantes, seguidas por camadas de pooling e totalmente conectadas para classificação ou regressão. Sua arquitetura permite capturar padrões locais e globais, tornando-as especialmente eficazes em tarefas como reconhecimento de imagens, detecção de objetos, segmentação semântica e processamento de linguagem natural. Aplicações práticas incluem diagnósticos médicos, veículos autônomos, sistemas de recomendação e análise de sentimentos. O sucesso das CNNs deve-se à sua capacidade de aprender representações complexas diretamente dos dados, reduzindo a necessidade de engenharia manual de características.

Biography:

Mestre em Sistemas Mecatrônicos (Visão Computacional) e Engenheiro de Controle e Automação (Mecatrônica) pela UnB. 5+ anos de experiência trabalhando com desenvolvimento de software, Data Science e Machine Learning com foco em processamento de imagem e visão computacional. Trabalhos em diversos ramos como engenharia aeroespacial, processamento de imagens de satélite, biometria, veículos autônomos e redes veiculares.

Email:






Agenda

 

Módulo 1: Introdução ao NLP
● Definições, objetivos e casos de uso.
● Ferramentas
Módulo 2: Técnicas Fundamentais
● Tokenização e normalização.
● Parsing de textos.
● Reconhecimento de entidades nomeadas (NER).
Módulo 3: Técnicas Avançadas
● Modelos de aprendizado supervisionado para classificação de
texto.
● Introdução a embeddings e representações distribuídas.
Módulo 4: Projeto Prático
● Desenvolvimento de uma aplicação NLP para resolução de
problemas reais.
● Discussão sobre submissão de artigos científicos baseados nos
projetos.