ITRT(IT Research Trends)

Designing and Optimizing Alignment Datasets for IoT Security: A Synergistic Approach with Static Analysis Insights

연구 분야: Strategies

논문 키워드: #optimize #vulnerabilities #security #hard #mitigation

학회: PROMISE '25: Proceedings of the 21st International Conference on Predictive Models and Data Analytics in Software Engineering

초록

Large Language Models (LLMs) show great promise for automating critical IoT security tasks, yet they often fail to address high-stakes vulnerabilities without domain-focused datasets. In this paper, we present a structured methodology to design and optimize IoT-specific alignment datasets informed by static analysis insights, thereby bridging the gap between generic language models and specialized IoT security requirements. Our approach integrates findings from IoT firmware analysis tools (e.g. FACT and Binwalk) with authoritative vulnerability repositories (MITRE CVE, CWE, CAPEC) to construct three key dataset types: (1) Base Datasets, capturing essential IoT vulnerabilities and configurations, (2) Classification Datasets, discerning IoT from non-IoT prompts, and (3) Alignment Datasets employing Contrastive Preference Optimization (CPO), Direct Preference Optimization (DPO), and Kahneman-Tversky Optimization (KTO) for IoT-specific fine-tuning. We further incorporate secure-by-design principles and bias mitigation strategies---ranging from device-type diversity to synthetic data augmentation---to ensure fair, high-fidelity representations of IoT security scenarios. Experimental results demonstrate that our alignment datasets improve LLM responsiveness and correctness for vulnerabilities discovered via offline static analysis, including outdated libraries, hard-coded credentials, and insecure default services. Notably, Kahneman-Tversky Optimization achieves a 97% alignment accuracy, reflecting the impact of clear binary classifications in high-stakes security tasks. This work underscores the significance of dual-system integration (static analysis plus LLM alignment) for proactive IoT defense. By foregrounding domain-specific vulnerabilities in carefully curated datasets, we enable LLMs to generate more actionable, context-aware security recommendations, thus advancing state-of-the-art IoT protections in both research and industry deployments.

Ahmad Al-Zuraiqi

Queen's University Belfast Belfast United Kingdom

United Kingdom

Des Greer

Queen's University Belfast Belfast United Kingdom

United Kingdom

📄 논문 정보

발행 연도	2025년
인용수	0
출판 국가	United Kingdom
사이트	ACM
좋아요 수	0

Designing and Optimizing Alignment Datasets for IoT Security: A Synergistic Approach with Static Analysis Insights

Designing and Optimizing Alignment Datasets for IoT Security: A Synergistic Approach with Static Analysis Insights

📄 논문 정보

연관 논문 목록 (398건) 내 서재 담기

연관 논문 목록 (398건)