검색

검색어는 최소 두 글자 이상 입력해주세요.

[사람사람들] AI 기반 기술로 산업 혁신을 꿈꾸다! 포스코DX 김수상 님

사람사람들

[사람사람들] AI 기반 기술로 산업 혁신을 꿈꾸다! 포스코DX 김수상 님

2025/10/14

안녕하세요. 포스코DX AI기술센터 김수상 프로입니다. 저는 공간 인지 전문가로서 선재·후판 크레인 자동화, Agentic AI* 및 AI Operator** 개발 등 다양한 연구를 맡고 있습니다. 신경망처리장치(NPU)를 적용한 AI 추론 최적화와 Vision 기술을 현장에 접목하며, 산업 현장의 혁신에 힘쓰고 있는 제 이야기를 여러분께 들려드리겠습니다!

*Agentic AI : 목표 달성을 위한 자율적 행동의 인공지능
**AI Operator : 조업자를 대신해 특정 작업을 독립적으로 수행하는 AI 에이전트

가장 기뻤던 순간은 최근 제가 쓴 논문이 세계 최고 권위의 국제컴퓨터비전학회(ICCV)에 채택된 일입니다. 박사과정 3년 차에 그간의 노력을 보상받은 것 같아 더욱 특별했습니다.

물론 그 과정은 쉽지 않았습니다. AI 연구는 단순히 논문을 읽는 것을 넘어, 직접 논문으로 문제 해결 능력을 증명해야 합니다. AI 분야는 워낙 빠르게 발전해 흐름을 따라가는 것조차 쉽지 않고요. 어렵게 제출한 논문이 거절당한 적도 많았고, 한창 진행하던 연구와 비슷한 주제의 논문이 먼저 발표돼 아쉽게 포기한 경험도 있죠. 이를 통해 연구란 성과를 내기 위해 꾸준히 노력해야 하고, ‘연구를 위한 연구’가 아니라 현장에 도움이 되는 실용적인 연구를 추구해야 한다는 것을 배울 수 있었습니다. 이후 연구 역량을 기르고자 연세대학교 AI 박사과정에 진학했고, 담당 교수님의 지도와 랩미팅을 통해 연구 성과를 끌어올렸습니다. 이렇게 피나는 노력 끝에 채택된 논문이라 감회가 더욱 새로운 것 같네요^^.

저는 IT 개발자로 입사해 현재는 AI 전문가로 일하고 있습니다. AI 붐이 일던 10년 전부터 딥러닝을 활용해 다양한 스마트 과제를 해결하려는 시도가 늘었는데요. 소프트웨어 개발자였던 저 역시 데이터 주도적인(Data-driven) 방식으로 소프트웨어를 만드는 것에 흥미를 느끼고, 기존 방식으로 풀지 못한 다양한 문제를 해결하면서 경험을 쌓았습니다.

AI 기술의 시각 인지 능력이 딥러닝을 통해 인간의 수준을 넘어서면서 이를 산업 현장에 적용할 기반이 마련됐는데요. 특히 포항 2선재 B동 제품창고에 적용된 LiDAR*를 활용한 3D Vision 기술인 선재 중심점 추정과 형상 인식 기술을 제어 시스템과 연동하면서 작업자의 시각 인지 능력을 대체할 수 있게 됐습니다.

선재 코일은 크기와 포장 형태가 일정하지 않아 형상 인식 난이도가 높고, 크레인으로 이송 시 흔들림이 심해 자동화가 어려운 영역으로 꼽혀왔는데요. 포스코DX의 AI 개발자들은 포스코와 협력을 통해 Vision AI**, 크레인 이동 최적화, 정밀 위치 제어 기술을 융합해 이러한 기술적 난제를 해결했습니다.

크레인에 부착된 LiDAR 센서는 MES(제조실행시스템)에서 내려온 작업 지시를 바탕으로 제품 야드에 적치된 해당 코일을 탐지하고, 중심점 위치와 규격(외경, 폭, 내경)을 인식합니다. 이후 작업해야 하는 코일 수량에 따라 크레인의 후크(C-Hook)가 진입할 깊이를 계산해 제어하는 것이죠. 이로써 적재된 코일이 쓰러져 있거나 다른 제품에 눌려 있는 비정형 환경에서도 안정적인 작업 자동화가 가능해졌습니다.

포스코그룹의 안면인식 솔루션인 Facero(페이스로)도 빼놓을 수 없는데요. Facero는 카메라로 얼굴을 인식해 출입 관리나 주요 인증 분야에 활용할 수 있는 솔루션으로, 자체 데이터 기반 딥러닝 모델을 통해 개개인의 얼굴을 식별하고 타인의 사진이나 영상 등을 구분해서 판단할 수 있는 기술입니다. 포스코DX가 하드웨어부터 소프트웨어까지 자체 개발했습니다.

이 기술은 2018년부터 2021년까지 포스코DX 전 사옥과 포스코, 포스코이앤씨, RIST 등 그룹사에 적용됐습니다. 2022년부터는 해당 기술을 응용해 제철소 현장에 Vision AI를 적용하고 있고요. 최근에는 공간 인지를 위한 3D Vision 기술을 넘어, 가상세계의 AI를 현실의 크레인 등 물리 설비와 직접 연결되는 피지컬 AI*** 영역으로도 확장하고 있습니다.

*LiDAR(Light Detection and Ranging) : 레이저 빔을 사용하여 물체와의 거리를 측정하는 기술
**Vision AI : 인공지능의 한 종류로, 이미지 데이터를 목적에 맞게 처리하고 판단하는 기술
***피지컬 AI(Physical AI) : 가상환경에서 만든 AI가 하드웨어와 결합해 물리적 환경에서 실시간으로 상호작용하며 복잡한 작업을 수행하는 기술

AI기술센터에는 최신 논문을 함께 리뷰하고 논문도 직접 작성하는 ‘Paper Shop’이라는 동아리가 있습니다. 빠르게 변화하는 AI 기술의 발전 속도를 따라가고자 논문 읽기와 쓰기에 관심 있는 직원들이 자발적으로 동아리를 결성한 것인데요.

동아리원들은 업무가 끝난 저녁 시간에 모여 논문 작성을 위한 연구 진행 상황을 공유하고, 최신 연구 동향을 논의하며 활동을 이어가고 있습니다. 구성원 모두가 연구 역량을 확보해 현장의 난제를 해결하는 것을 목표로 하고 있죠.

동아리에는 젊고 역량 있는 직원들이 많아 연구에 대한 관심과 열정도 높습니다. 올해에는 한국컴퓨터종합학술대회(KCC)에 논문 2편을 발표했고, 앞으로도 해외 탑 컨퍼런스를 비롯한 다양한 학회에 지속적으로 도전할 계획인데요. 연구 역량을 키워나가며 회사의 기술력도 널리 알리는 저희 모습 지켜봐 주세요~

제 일이지만 저는 AI 이야기를 할 때 가장 즐겁습니다. 요즘은 AI 트렌드에 관심을 갖고 있는데요. 최근 탑 티어 AI 컨퍼런스에서는 LLM(대형 언어 모델)*과 VLM(비전-언어 모델)** 같은 파운데이션 모델을 활용한 연구들이 큰 흐름을 이루고 있어요. LLM의 확장성(Scaling Law)과 새로운 능력(Emergent Abilities) 덕분에 지금까지 풀지 못했던 다양한 문제가 해결되고 있고, 이를 기반으로 여러 혁신 기술이 계속 등장하고 있죠.

포스코DX도 AI 에이전트나 파운데이션 모델을 활용해 현장의 문제들을 해결하고 있는데요. AI 분야의 변화와 발전 속도가 매우 빠른 만큼, 최신 트렌드와 기술을 지속적으로 공부해 현장에 산적한 많은 문제들을 해결하고 싶습니다!

*LLM(Large Language Model·대형 언어 모델) : 대규모 텍스트 데이터를 학습해 자연어 이해와 생성에 뛰어난 성능을 보이는 인공지능 모델. GPT-3, BERT, LLaMA 등이 대표적
**VLM(Vision-Language Model·비전-언어 모델) : 이미지와 텍스트를 동시에 이해하는 멀티 모달 AI로, 기존의 텍스트 중심 AI 기술의 한계를 극복하고 있다.

이것만은 꼭 이루고 싶습니다!

“신입사원들이 더 뛰어난 전문가로 성장할 수 있도록 돕겠습니다!”
팀원이 늘어나고 조직이 커지면서 기술 방향성을 제시하고 팀원들의 역량을 키우는 일에 관심이 늘었습니다. 특히 대학원을 갓 졸업한 신입사원의 성장에 도움이 되고 싶은데요. 궁극적으로는 저보다 더 뛰어난 전문가로 성장하도록 돕는 것이 가장 큰 목표입니다. 그 과정에서 저도 성장하고, 회사에도 기여할 수 있지 않을까요?

관련 글 보기

URL 복사

복사 버튼을 클릭하면 클립보드에 복사됩니다.

공유하기

복사 버튼을 클릭하면 클립보드에 복사됩니다.

맨 위로