DeepLearning

  • 딥러닝 이미지 인식

    딥러닝 이미지 인식

    2020.2-2020.12 | 산학과제: 이상치 검출을 위한 Fewshot learning 기반 이미지 인식 [이미지 인식 연구를 마치며, 연구자로서...] 요즘 가짜 이미지가 너무 진짜 같아서 사회에 사이버 범죄로 사용된다, AI가 사람들의 일자리를 없앤다, 제3 국가와 IT극단을 발생시킨다 등의 생각으로 점점 딥러닝과 기술은 사회에서 대단하지만 위험한 존재로 인식되고 있습니다. 저의 연구 방향은 기회가 된다면 이미지 인식, GAN등을 깊게 공부해 현재까지 기술의 한계와 접목되지 못하는 부분을 보안, 장애인, 의료, 개발도상국 국가의 스마트 팩토리 구축 등의 분야에서 찾고 이를 결합하여 저만의 새로운 방법론을 내는 연구를 하는 것 입니다. 또 이를 통해 딥러닝의 순기능을 사회에 알리고 SCI에 출판 할..

  • WICWIU 학부생 개발 딥러닝 프레임 워크

    WICWIU 학부생 개발 딥러닝 프레임 워크

    2020.2-2020.12 | 국내 최초 학부생들이 개발하는 C++ 오픈소스 딥러닝 프레임워크 [WICWIU 개발 Challenge-인터뷰 형식] 질문: 위큐사용경험에대해알려주세요. 답변: 작년 한해 딥러닝 이미지 인식 기반 Fewshot 학습을 통한 이상치 검출이라는 주제로 WICWIU오픈소스를사용해서산학 연구를 진행했습니다.저는 이 프로젝트에서 WICWIU를사용해서사용자 정의Dataset을 만들고, Data Loader쪽 랜덤 블록 알고리즘, 결과 산출 및 실험을 담당하였습니다. 온디바이스라는제한적환경에서회사의 요청 사항으로 이 프로젝트는 WICWIU를이용해서진행하게되었습니다. 질문:위큐사용에어려운점은없었나요? 답변: 처음 WICWIU 처럼 큰 다른 사람이 짠 코드로 만들어진 프로젝트를 이해하는 건 ..

  • [1]Introduction to Speech Preprocessing

    [1]Introduction to Speech Preprocessing

    [1]Introduction to Speech Preprocessing [Speech Processing Task] 1)ASR- 음성신호를 받아서, 텍스트를 추출하는 과정 Speaker identification- 일종의 classification 문제로, 음성신호를 주면, 화자가 누구인지 맞추는 과정 2)Speaker verification- 음성신호와 특정 화자의 아이디를 주면, 이게 그 사람의 목소리가 맞는지 아닌지 맞추는 문제. 3)Speech emotion recognition- 음성신호를 받아서 어떠한 감정으로 말한건지 판단하는 문제이다. 4)Text-to-Speech(TTS)-*** 어떤 텍스트를 주고, 텍스트에 맞춰 음성신호로 바꾸는 분야이다. 특정인의 음성만 만들어 내거나, 여러사람의 음..

Projects

  • MOA 대학생을 위한 공동구매 플랫폼
  • 한동대학교 시선

    한동대학교 시선

    2019 | 시각장애인을 위한 버스 알리미 어플 [나의 관심사 형성] 저는 2학년 1학기 포항시 시각장애인 복지관에서 저 시력 장애인분들을 만나고 음성안내 때문에 민원이 발생했고, 버스 정류장에 음성 안내가 사라지고 있다는 사실을 알게 되었습니다. 그 결과 저 시력 장애인 분들은 본인 앞에 지나가는 버스가 몇 번 버스인지 인지 할 수 없어서 버스 이용에 큰 불편함을 느끼고 있다는 이야기를 들었습니다. 이러한 문제를 해결하기 위해 복지관과 소통하며 저 시력 장애인을 위한 음성 안내 서비스 버스 알리미 어플리케이션을 만들었습니다. 처음 개발을 할 때 저희가 생각할 수 있는 건, 공공 API를 가져와 버스가 도착할 때 정보를 읽어 주는 것 이였습니다. 하지만, 개발을 하고 나니 추가 기능을 덧붙여야 정말로 이..

  • NongBer 프로젝트

대회 수상

  • Hackathon

    Hackathon

    [제 6회 대한민국 SW 융합 해커톤 대회 | 광주광역시장상(2등)] [제 4회 Global Innovative Festa | 경북대학교 총장상] [UI 플로우] [제 2회 SW festival | 한동대학교 총장상] 청각장애인이 음악을 즐길 수 있게 도와주는 어플리케이션 진동헤드셋과 휴대폰을 연결한뒤 어플을 연결해서, 그 음에 맞는 코드의 진동을 진동헤드셋으로 느낄 수 있게 도와줌​. 조사에 따르면 장애인 분들의 여가생활에 대한 만족도는 대체로 낮다. 이 프로젝트는 그 분들의 여가생활에 대한 만족도를 높이는 것을 2차적 목적으로 한다. 기존방식으로는 뮤직 시트가 있다 뮤직시트는 총 4개의 진동스피커를 통해 등 부분에는 강한 진동을 허벅지 부분에는 약한 떨림을 느낄 수 있도록 한다. 그리고 음악의 박자와..

Developer Tools

Developer Communication

Developer Server

Programming Practice

알아두면 편한 개발지식

  • vim

    vim

    자주 사용하는 빔 명령어 정리 [기본] 1. 커서를 움직일 때에는 화살표 키나 hjkl 키를 이용합니다. h (왼쪽) j (아래) k (위) l (오른쪽) 2. 수정한 내용을 무시한 채로 빔에서 빠져나가려면 :q! 저장한 후 빔에서 빠져나가려면 :wq 3.i를 누르면 insert 4.이전 행동을 취소하려면: u (소문자 u) 5.p 붙이기 6. r 리플레이스, ce 체인지 [지우는것] 1. 커서가 위치한 곳부터 단어의 끝까지 지우려면: dw 2. 커서가 위치한 곳부터 줄 끝까지 지우려면: d$ 3. 줄 전체를 지우려면: dd 4. x : 그 한 캐릭터 지우기 [이동] 1. 2w : 2 단어씩 이동 2. 커서를 문장 맨 앞으로 옮기려면: 0 3. 커서가 (,),[,],{,} 위에 있을 때에 % 를 입력하면..

  • MarkDown 실시간 서버 확인

    MarkDown 실시간 서버 확인

    문서작성법 시작하기에 앞서 꼭 기억해야 할것은 우리에게는 두가지의 원격저장소가 있다. 하나는, https://github.com/HGUSight/HGUSightblog 이 저장소는 우리의 전체 파일을 수정하고 고치기 위함이다. 두번째는, https://github.com/HGUSight/HGUSight.github.io 이 저장소는 빌드 파일인 site파일만 올려서 우리의 웹페이지를 렌더링하기 위함이다. 다음 명령어를 따라하면, 문제들을 해결하고 올릴수 있다. 하지만 정확한 이해를 위해서는 깃을 공부하는것이 꼭 필요하다. 깃허브에서 레파지토리를 클론해서 가져온다. 작성은 왠만하면 각팀의 팀장이나 문서 작성 담당자 1인이 담당한다. git clone https://github.com/HGUSight/HGU..

  • C++ google style convention 과  CppCoreGuidelines

    C++ google style convention 과 CppCoreGuidelines

    [CppCoreGuidelines 한국어 번역] 핵심 가이드라인의 목적은 개발자들이 모던 C++ (현재는 C++17)을 받아들이고 보다 일관적인 형태의 스타일로 코드를 작성하도록 하는 것이다. 이 문서에서 다루고 있는 규칙들이 모든 코드에 효과적으로 적용할 수 있다고 생각하지는 않는다. 오래된 시스템을 새롭게 업그레이드하는 것은 쉽지 않은 일이다. 하지만 여기서 다루는 규칙들을 적용한다면 기존의 방식보다 오류가 발생할 가능성이 낮고, 유지 보수가 편리한 코드를 작성할 수 있을 것이라 확신한다. 또한 이러한 규칙들은 개발 초기에 좀 더 빠르고 쉽게 개발을 진행하는 데도 도움이 될 것이다. 분명히 말할 수 있는 것은, 이러한 규칙들을 적용하면 제로-비용 원칙(Zero-overhead principle)에 입..

  • 파이썬을 쉽게 이용할수 있는 bpython

    파이썬을 쉽게 이용할수 있는 bpython

    bpython-interpreter.org/downloads.html Downloads - bpython Downloads The easiest way to get bpython is by installing it with pip, preferably in your virtual environment. There are several other ways of installing or getting the source to bpython as well. Release tarball The latest release for bpython is 0.19 and y bpython-interpreter.org 안에 링크에 들어가면 os별로 설치 코멘트가 있다.

  • 맞춤형 Linux 서버 초기 설정

    맞춤형 Linux 서버 초기 설정

    나만의 LINUX CLI 환경설정 [1단계: o-my-zsh shell 설치] sh -c "$(curl -fsSL https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh)" sh -c "$(wget https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh -O -)" [2단계:테마 바꾸기] vim ~/.zshrc THEME="agnoster" 다른 theme : https://github.com/ohmyzsh/ohmyzsh/wiki/Themes [3단계: 폰트 설치] https://github.com/powerline/fonts ..

딥러닝 정리

  • ResNet 논문정리

    ResNet 논문정리

    ResNet 논문 정리 0.Abstract 이 논문에 ResNet은 152개의 layer로 구성되었고, ILSVRC 2015 ImageNet Dataset classification 부분에서 top-5 error 3.57%로 1위를 기록하였다. 또한 ImageNet Dataset뿐만이 아니라, CIFAR-10등 다양한 데이터셋에서도 좋은 성능을 내고 있다. 이는 전년도 우승 네트워크 구조인 GoogleNet의 22개의 layer보다 무려 8배나 더 깊은 네트워크를 만들어 성공시켰다는 점에서 딥러닝 역사에 한 획을 그은 논문으로 평가 받고 있다. !!! tldr "레즈넷 핵심 이해" - [X] `레즈넷의 우수성` : `더 깊은 네트워크 구축` - [ ] `Degradation`: - [ ] `Reforma..

  • [1]Introduction to Speech Preprocessing

    [1]Introduction to Speech Preprocessing

    [1]Introduction to Speech Preprocessing [Speech Processing Task] 1)ASR- 음성신호를 받아서, 텍스트를 추출하는 과정 Speaker identification- 일종의 classification 문제로, 음성신호를 주면, 화자가 누구인지 맞추는 과정 2)Speaker verification- 음성신호와 특정 화자의 아이디를 주면, 이게 그 사람의 목소리가 맞는지 아닌지 맞추는 문제. 3)Speech emotion recognition- 음성신호를 받아서 어떠한 감정으로 말한건지 판단하는 문제이다. 4)Text-to-Speech(TTS)-*** 어떤 텍스트를 주고, 텍스트에 맞춰 음성신호로 바꾸는 분야이다. 특정인의 음성만 만들어 내거나, 여러사람의 음..