俺が仮にこれを作るとして
まず最初に作らなきゃいけない機能はイメージ検索か。
グーグルのイメージ検索のように指定された単語と関連性の高い画像を
ネットから拾ってくる。

その上で上位10画像くらいからこういうものだとAIに判断させる

もちろん画像は画像、著作権が存在するし 他人が勝手に使っていいものじゃない
あくまでもAIがその総合的イメージを総括して新しい絵を書く必要がある

何かをごちゃまぜにして合成するんじゃなく、絵を描くんだから
「りんご」と指定しても毎回違う趣の絵であることが望ましい

こんな感じかな?